Podcasts about vertex ai

  • 93PODCASTS
  • 166EPISODES
  • 30mAVG DURATION
  • 1EPISODE EVERY OTHER WEEK
  • Jun 15, 2026LATEST

POPULARITY

20192020202120222023202420252026


Best podcasts about vertex ai

Latest podcast episodes about vertex ai

The Six Five with Patrick Moorhead and Daniel Newman
Apple's Siri Bet on Gemini, SpaceX's $1.77T IPO, and Claude Fable 5's Hyperscaler-Neutral Launch

The Six Five with Patrick Moorhead and Daniel Newman

Play Episode Listen Later Jun 15, 2026 64:35


Patrick Moorhead and Daniel Newman cover Tim Cook's final WWDC as CEO and Apple's Gemini-powered Siri strategy, the $35 billion Apollo and Blackstone deal backing Anthropic's capacity expansion, Intel's packaging wins with Google and NVIDIA, SpaceX's IPO at a $1.77 trillion valuation, Anthropic's Claude Fable 5 and Mythos 5 launch across every major cloud, and earnings reactions from Oracle, Micron, and Adobe. The handpicked topics for this week are: Apple's Siri AI Will Run on Gemini, Closing Out Tim Cook's Final WWDC as CEO: At WWDC, Apple confirmed Siri AI will run on Gemini through a new billion-dollar per year, multi-year deal, while Apple's Foundation Model Cloud Pro runs on NVIDIA GPUs inside Google Cloud. The announcement marks Tim Cook's last WWDC as CEO before John Ternus takes over on September 1. Apple isn't building its own AI cluster or competing on CapEx. They're betting that by owning the consumption layer, backed by access to health data and private messaging through iMessage, Apple will have a moat that compute spending can't replicate. (The Decode) Apollo and Blackstone Close the Largest Private Credit Deal Ever Backing Anthropic's Capacity Expansion: A $35 billion deal, the largest private credit transaction on record, will fund Google TPU capacity tied to Anthropic's compute needs, with Broadcom backstopping senior debt tranches and Google backstopping lease payments. The structure treats compute as a lendable asset class and signals more than 20 gigawatts of demand still being built out through 2028. Circular financing between chipmakers, cloud providers, and AI labs has moved from controversial to standard practice. (The Decode) Intel's Foundry Wins Packaging Work on Google's TPUs, Not a Full Fab Deal: Reports that Intel landed a deal tied to Google and NVIDIA reframe what's actually being handed off. Intel gets the packaging work on over 3 million TPUs, the compute die stays with TSMC, and the I/O die is being negotiated with Samsung at 2nm. INTC rose 12% Monday. The deal represents a low-risk path for Intel to augment, not replace, TSMC, while raising questions about anti-competitive dynamics in the foundry market. (The Decode) SpaceX Becomes an AI Infrastructure Company With a $1.77 Trillion IPO: SpaceX's IPO priced amid oversubscribed demand, with its valuation now reflecting not just Starlink connectivity and launch dominance but a newly material AI business, including AI1 orbital data center tests planned for late 2027 and a $920 million per month Google compute contract running through 2029. A sum-of-the-parts breakdown of the connectivity, launch, and AI segments lands well short of the trading price, with the gap largely explained by confidence in Elon Musk's track record of execution. (The Decode) Anthropic Launches Claude Fable 5 and Mythos 5 Across Every Major Cloud: Anthropic shipped Claude Fable 5 and Mythos 5 with same-day availability across Snowflake, AWS Bedrock, Vertex AI, and Microsoft Foundry, pricing at $10 and $50 per million tokens. The hyperscaler-neutral distribution strategy lands ahead of Anthropic's anticipated IPO. The models represent a real step up in research capability over Opus 4.8, but they come with a significant change. Users no longer have the option to opt out of data sharing with Anthropic, a shift some enterprises, including Microsoft, are already responding to. (The Decode) Is SpaceX a Once-in-a-Generation Entry or the Top of the Market? One side argues SpaceX represents a generational opportunity on par with early Amazon or Netflix, with interplanetary travel and off-world resource extraction as the long-term payoff that justifies looking past current valuation math. The other side argues this is peak euphoria: a company trading at roughly 95 times sales, propped up in part by circular investment from Google into both SpaceX and its AI segment, with a steep drawdown likely before any sustained climb. (The Flip) The Chip and Security Trade Reverses From Broken to Bifurcated: The semiconductor sector posted its biggest single-day gain since 2020, with the SOX up 5% on Monday, June 8, as a prior selloff in names like Broadcom, CrowdStrike, and Palo Alto Networks fully reversed. Intel rose 12%, Marvell 10%, and Corning 7%. The rebound reframes the AI trade narrative from a broad breakdown to a split between winners and laggards within the same sector. (Bulls & Bears) Oracle Posts a Record Quarter, But the Market Focuses on a $50 Billion Funding Plan: Oracle delivered record revenue of $19.2 billion, up 21 %, with EPS of $2.11, beating estimates of $1.89. IaaS grew 93 %, the fastest pace among hyperscalers, and RPO hit $638 billion, up $85 billion quarter over quarter, including $75 billion in AI contracts. FY27 guidance of $90 billion was maintained, and EPS guidance was raised, yet the stock fell 5% after hours amid concerns about Oracle's capital spending plans. Oracle's AI cloud backlog now exceeds those of AWS, Google, and Microsoft, built heavily on commitments from Anthropic and OpenAI. (Bulls & Bears) Micron's Profit Trajectory Puts It in Google's Earnings Tier: Micron is projected to generate nearly as much profit in 2027 as Google, with Q2 revenue of $23.86 billion, up 22 % and beating estimates, and Q3 guidance of $33.5 billion in revenue, $19.15 EPS, and 81 % gross margin. The stock is up 776%, with Wall Street firms, including UBS, raising price targets. The open question is whether memory has broken its historically cyclical pattern given sustained AI demand. (Bulls & Bears) Adobe Beats Across the Board, But the Stock Drops on CEO Departure and Freemium Pivot: Adobe posted record revenue of $6.62 billion, up 13 % and beating consensus of $6.45 billion, with non-GAAP EPS of $5.96, topping estimates of $5.81. AI first ARR tripled year over year to over $500 million, with total ARR reaching $27.1 billion, and FY26 guidance was raised. The stock still fell 5.5 % after hours, driven by the CFO's departure to Marvell and market concern over a strategic shift toward freemium pricing that delays near-term profitability. (Bulls & Bears) Watch the full video at sixfivemedia.com, and be sure to subscribe to our YouTube channel so you never miss an episode. The Decode Apple WWDC- Apple Caves to Google AND NVIDIA — Siri AI Runs on Gemini ($1B/yr) + Apple Foundation Model Cloud Pro Runs on NVIDIA GPUs in Google Cloud; Tim Cook's Final WWDC as CEO Before John Ternus Succeeds Him Sept 1 https://www.cnbc.com/2026/06/08/apple-wwdc-2026-live-updates.html Google's $35B Infra Deal — Apollo + Blackstone Close the Largest Private Credit Deal Ever; Broadcom Backstops Senior Tranches; Google Backstops Lease Payments https://www.reuters.com/business/apollo-blackstone-back-anthropics-35-billion-capacity-expansion-new-broadcom-tie-2026-06-09/ Intel's Foundry Reportedly Wins Google Packaging (Not Full Fab) — The Information Reframed: 3M+ TPU Packaging by Intel, Compute Die Still TSMC, I/O Die Being Negotiated With Samsung 2nm; INTC +12% Monday; Pat Calls Out TSMC Anti-Competitive Risk https://www.trendforce.com/news/2026/06/09/news-intel-foundry-gains-momentum-as-google-reportedly-orders-3m-tpus-nvidia-evaluates-18a-for-multi-die-gpu-design/ SpaceX Becomes an AI Infrastructure Company — Friday IPO at $1.77T; AI1 Orbital Data Center Tests Late 2027; Google $920M/mo Compute Contract Through 2029 https://finance.yahoo.com/markets/stocks/articles/spacex-poised-history-record-75-100000402.html Anthropic Ships Claude Fable 5 + Mythos 5 — Same-Day Distribution Across Snowflake, AWS Bedrock, Vertex AI, Microsoft Foundry; Hyperscaler-Neutral by Design Ahead of IPO; $10/$50 per M Tokens https://www.anthropic.com/news/claude-fable-5-mythos-5 The Flip FOR: https://www.cnbc.com/2026/06/11/spacex-billionaire-investing.html AGAINST: https://www.nytimes.com/2026/05/20/technology/elon-musk-spacex-ipo.html Bulls & Bears The Chip + Security Tape Recovery — SOX +5% Monday June 8 (Biggest Day Since 2020); AVGO/CRWD/PANW Selloff Reversed; Intel +12%, Marvell +10%, Corning +7%; the AI Trade Pivots From "Broken" to "Bifurcated" https://www.investopedia.com/stock-market-today-dow-jones-s-and-p-500-06082026-11992852 Oracle (ORCL) Q4 FY26 ACTUALS — Record $19.2B Rev (+21%), EPS $2.11 Beat ($1.89); IaaS +93%; RPO HITS $638B (+$85B QoQ, $75B AI Contracts); FY27 $90B Guide Maintained, EPS Guide Raised; Stock −5% AH on Massive Capex Plan https://www.tradingkey.com/analysis/stocks/us-stocks/261959450-oracle-record-q4-2026-earnings-report-cloud-data-center-stock-tradingkey "$MU Will Generate Almost As Much Profit in 2027 as $GOOGL"; Q2 Rev $23.86B (+22% Beat), Q3 Guide $33.50B / $19.15 EPS / 81% GM; MU Stock +776%; UBS Among Wall Street Raising Targets https://247wallst.com/investing/2026/06/11/wall-street-just-put-a-monster-target-on-micron-is-the-stock-still-too-cheap/ Adobe (ADBE) Q2 FY26 ACTUALS — Record $6.62B Rev (+13%) Beats Consensus $6.45B; Non-GAAP EPS $5.96 Beats $5.81; AI-First ARR Triples YoY to $500M+; Total ARR $27.10B; FY26 Guide RAISED; Stock −5.5% AH Despite Beat-and-Raise https://www.businesswire.com/news/home/20260611677110/en/Adobe-Reports-Record-Q2-Results    

Everyday AI Podcast – An AI and ChatGPT Podcast
Ep 797: Claude's Mythos and Fable 5, Google's New Live AI, ChatGPT's New Powers and 7 Other AI Features You Can't Afford To Not Use

Everyday AI Podcast – An AI and ChatGPT Podcast

Play Episode Listen Later Jun 12, 2026 36:31


If you spent too much time prompting Claude's Fable 5 before it likely goes away to subscribers in 10 days, you might have missed some AI gems.

The Ravit Show
Context for Agentic Success

The Ravit Show

Play Episode Listen Later May 28, 2026 8:38


Everyone is talking about AI agents, but after my conversation with Ben Kus, CTO at Box at Google Cloud Next 2026 on The Ravit Show, one thing became very clear. Agents are useless without "context". #boxpartnerBen kept coming back to that word. Not just data, not just models, but context. In an enterprise setting, context means understanding the full picture around your data. Who created it, where it lives, who can access it, and how it should be used. Most companies already have massive amounts of content, but it is fragmented and static, and that is the real problem.What stood out is how Box is approaching this. They are not just storing enterprise content, they are structuring it in a way that AI agents can actually use, turning content into something agents can reason on, not just retrieve. And this is where the partnership with Google Cloud comes in. With models like Gemini and platforms like Vertex AI, they are able to operationalize that context at scale in real workflows.The biggest takeaway for me was simple. If you want to become AI-first with agents, do not start with the agent. Start with your data. Structure it, govern it, and make it usable. That is what actually makes AI work.#data #ai #box #security #googlecloudnext #api #google #theravitshow

The Ravit Show
Agentic Governance + Security

The Ravit Show

Play Episode Listen Later May 28, 2026 12:47


AI agents sound exciting. But my conversation with A. Ravi M., CIO at Box at Google Cloud Next '26 on The Ravit Show was not about excitement.It was about risk. We are moving from AI that answers to AI that acts. And that shift introduces a completely new set of challenges. Not just accuracy, but control, access, and accountability. Ravi pointed out that most enterprises are not struggling with AI capability. They are struggling with governance. Who has access to what data, what an agent is allowed to do, and how you track those actions. Those gaps become very real once agents start operating on sensitive enterprise content.And that is where security needs to evolve. It is no longer enough to protect data at rest. You have to think about how AI agents interact with that data in real time, and what guardrails are in place when they take action.The partnership with Google Cloud plays a big role here. With platforms like Vertex AI and BigQuery, the focus is not just on building agents, but on building them with the right controls and visibility from day one.The biggest takeaway for me was simple. If you are a CIO thinking about AI agents, do not start with deployment. Start with trust. Because without that, none of this scales.#data #ai #box #security #googlecloudnext #api #google #theravitshow

What's new in Cloud FinOps?
WNiCF - April 2026 - News

What's new in Cloud FinOps?

Play Episode Listen Later May 22, 2026 54:58


Send us Fan MailWhat's New in Cloud FinOps: May 2026 Monthly RecapIn this combined monthly recap for May 2026, Frank Contrepois and Stephen Old dive into a vast array of updates across AWS, Google Cloud, and Azure, with a special focus on the evolving landscape of AI FinOps, hybrid cloud challenges, and a barrage of storage news.The Expanding Scope of FinOps: From Data Centre to AIThe discussion opens by exploring the expansion of FinOps beyond the public cloud to encompass on-premise data centres, software, AI, and sustainability. A central theme is the application of the FinOps Open Cost and Usage Specification (FOCUS) to on-premise environments. Stephen shares firsthand experience transposing software data into FOCUS to create a converged platform, highlighting the fundamental data challenges, from ingesting contract data to managing the high velocity of cloud data.The conversation then shifts to the burgeoning role of AI, noting its inclusion alongside SaaS and professional services in the modern FinOps scope. This introduces new forecasting challenges, as traditional 18-month budget cycles clash with the rapid pace of weekly AI model releases.A critical point is also raised regarding sustainability. The hosts discuss Amazon's board rejecting a shareholder proposal for detailed climate disclosures, which poses a significant challenge for companies needing granular data for CSRD and SEC compliance.Major Cloud Updates: April 2026AI & FinOps Visibility:A major theme is the improvement in attributing AI spend. A game-changing update from AWS means Bedrock API calls now automatically record the IAM identity (user or role) of the caller directly into CUR 2.0 and Cost Explorer. This eliminates the complex need to reconcile CloudTrail logs to determine who is driving Bedrock costs.Similarly, Amazon Q is now embedded in the AWS Cost Explorer, allowing users to ask natural language questions about their spending (e.g., "Why did my RDS costs spike last month?"). This conversational analysis approach comes with a free tier of 50 queries per month.On the Google Cloud side, a new billing overview widget for Gemini and Vertex AI spend is now in preview. Google is also introducing a "FinOps Explainability Agent," an autonomous AI agent to investigate AI cost drivers, and "Spend Caps" (Private Preview) for services like AI Studio and Vertex AI, which provide crucial cost control by pausing API traffic when a budget is hit.For those managing GPU workloads, Amazon ECS managed instances now support NVIDIA GPU metrics in CloudWatch Container Insights, enabling real-time visibility into GPU utilisation and health to optimise expensive accelerated computing.Cost & Usage Reporting (CUR) Enhancements:There are hints of a potential enhancement to AWS CUR 2.0, which could see new columns added to directly link API calls with costs, revolutionising cost allocation. AWS has also introduced:Scheduled Email Delivery for Billing Dashboards: Securely send reports to stakeholders without console access.Billing Conductor Pass-Through Plan: Simplifies centralised billing for billing transfer users.Cost Optimization Hub CSV Downloads: Easily export savings recommendations.Find out how to leverage CUR for security: "Identifying security risks using AWS cost and usage report data"Compute & Database Innovations:AWS: Released a wave of 8th Generation Intel Instances (C8i, M8i, R8i and network-optimised versions) powered by custom 6th Gen Xeon processors. EC2 Capacity Manager also now supports tag-based dimensions, allowing for more granular capacity optimisation. Amazon Aurora Serverless now boasts up to 30% better performance and, crucially, scales down to zero, a cost-effective option for unpredictable agentic AI workloads.Google Cloud: At Google Cloud Next, they announced both ends of the performance spectrum. The 8th Generation TPUs (v8t for training, v8i for inference) offer massive scale and performance-per-dollar improvements. In a move to democratise access, Google also made fractional GPUs (1/2, 1/4, or 1/8) on the G4 series generally available, a game-changer for cost-effectively running smaller workloads. The GKE workload recommender is also now integrated into the FinOps Hub.Azure: Now supports NVIDIA's powerful H100 and H200 GPUs on Azure Red Hat OpenShift (ARO) for large-scale AI/HPC workloads. For database users, the GA of Premium SSD v2 for Azure Database for PostgreSQL promises significantly higher IOPS and better price-performance.A Deep Dive into Azure Storage:The episode covers an "overload" of Azure storage updates with significant FinOps implications:Minimum Billable Object Size: From 1st July 2026 for new accounts (and 2027 for all), objects smaller than 128KB in cool, cold, and archive tiers will be billed as if they are 128KB.Smart Tier for Azure Blob & ADLS (GA): To mitigate the above, this feature automatically tiers data based on access patterns but introduces a monitoring fee for objects over 128KB, creating a new optimisation puzzle.Azure NetApp Files (ANF) Ransomware Protection: Now GA and included as part of the service at no extra charge.Finally, the hosts tackle "The Big Silence on Memory Prices," noting that despite DDR memory prices soaring 300-400% from mid-2025 lows, the hyperscalers have remained silent, absorbing the cost and making it difficult for smaller providers to compete.Explore the official announcements:AI Bill of Materials Whitepaper: www.wiz.io/go/ai-security/ai-bill-of-materialsAWS Article on Amazon Q: https://aws.amazon.com/blogs/aws-cloud-financial-management/transforming-finops-with-the-latest-amazon-q-cost-capabilities/ 

PolySécure Podcast
Spécial - Retour sur Google Next 2026 - Parce que... c'est l'épisode 0x2FD!

PolySécure Podcast

Play Episode Listen Later May 21, 2026 25:12


Parce que… c'est l'épisode 0x2FD! Shameless plug 3 au 5 juin 2026 - SSTIC 2026 24 et 25 juin 2026 - Troopers 26 et 27 juin 2026 - leHACK 19 septembre 2026 - Bsides Montréal 1 au 3 décembre 2026 - Forum INCYBER - Canada 2026 24 et 25 février 2027 - SéQCure 2027 Description Dans cet épisode spécial, Nicolas Bédard revient sur sa participation à Google Next 2026, son quatrième événement du genre, mais le premier qu'il vivait en tant qu'employé de Palo Alto plutôt que de Google. Il y présente les quatre intégrations majeures que Palo Alto a lancées en partenariat avec Google, dans un contexte où l'intelligence artificielle agentielle se déploie à grande vitesse — souvent sans encadrement de sécurité adéquat. Le contexte : la plateforme Gemini Enterprise se réorganise Avant d'aborder les intégrations, Nicolas explique les changements de nomenclature chez Google. Gemini Enterprise est désormais divisé en deux volets : Gemini Enterprise Apps : l'interface utilisateur permettant d'accéder aux agents, aux connecteurs de données (SharePoint, Outlook, etc.) et aux outils IA. Gemini Enterprise AI Platform : la couche cloud sous-jacente, qui remplace l'ancienne plateforme Vertex AI. Cette restructuration simplifie la compréhension de l'écosystème : tout ce qui touche à l'IA en entreprise chez Google s'appelle désormais Gemini Enterprise. Intégration 1 — Prisma AIRS dans l'Agent Gateway La première et probablement la plus stratégique des intégrations concerne Agent Gateway, une nouvelle fonction au cœur d'Agent Cloud, la plateforme Google pour exécuter des agents IA. Agent Gateway agit comme un point d'insertion au sein des load balancers internes : il permet d'injecter des fonctions de sécurité ou d'autres capacités dans les flux de communication entre agents, entre un agent et un serveur MCP, ou entre un utilisateur et son agent. Palo Alto a annoncé l'intégration de son AI Runtime de Prisma AIRS directement dans ce gateway. L'idée est de centraliser la sécurité plutôt que de la déléguer à chaque développeur. Concrètement, cela signifie que les garde-fous — validation des comportements, prévention des fuites de données, protection contre les abus — s'appliquent automatiquement à tous les agents, sans que les équipes de développement aient besoin d'expertise en cybersécurité. Agent Gateway s'articule autour de trois piliers : l'identité, le runtime (pare-feu IA) et l'observabilité. Pour l'instant, seuls les deux premiers sont ouverts aux partenaires tiers comme Palo Alto. Cette approche répond directement à la préoccupation numéro un des équipes de sécurité en entreprise : le Shadow AI, soit l'utilisation non contrôlée d'outils IA par des employés ou des développeurs, qui expose l'organisation à des risques importants. Intégration 2 — Le scan de modèles open source via Gemini Enterprise Apps La deuxième intégration adresse un risque souvent sous-estimé : l'utilisation de modèles IA provenant de plateformes communautaires comme Hugging Face. Si les grands modèles commerciaux (Google, Anthropic, OpenAI, Mistral) offrent des garanties relatives à leur provenance, les modèles open source sont publiés par n'importe qui, sans vérification systématique. Ils peuvent contenir des vulnérabilités cachées, des kill switches, du code malveillant dissimulé dans l'enveloppe du fichier (notamment via des fichiers pickle), ou avoir été entraînés sur des données douteuses. Palo Alto a lancé un agent de scan de modèles directement accessible depuis Gemini Enterprise Apps. Intégré au cycle de développement logiciel (SDLC), cet agent permet à un développeur de soumettre un modèle hébergé sur Hugging Face ou dans un registre interne pour vérification avant déploiement — sans avoir à sortir de son environnement de travail habituel. Nicolas précise que cet agent fonctionne dans le tenant du client, ce qui garantit que les données restent dans l'infrastructure de l'entreprise. Intégration 3 — Wildfire et l'analyse de malwares dans les flux IA La troisième intégration s'inscrit dans une approche plus classique, mais essentielle : la détection de malwares dans les fichiers transitant par des agents IA. Google utilisait déjà la technologie de pare-feu de Palo Alto pour son Cloud NGFW. Ce qui est nouveau à Google Next, c'est l'ajout de Wildfire, le moteur de sandboxing de Palo Alto, sous la forme d'un service géré appelé Advance Malware Sandboxing. Concrètement : lorsqu'un utilisateur envoie un fichier via un agent Gemini Enterprise — vers un dépôt documentaire, par exemple — ce fichier est intercepté, analysé dans un environnement isolé, puis validé avant d'être stocké. Cela protège les autres utilisateurs ou agents qui pourraient accéder à ce fichier ultérieurement. L'enjeu est d'autant plus grand que les malwares générés par IA sont désormais créés on the fly, spécifiquement pour une cible, ce qui rend les approches basées sur des signatures connues insuffisantes. Intégration 4 — Le pare-feu dans l'Application Design Center La quatrième intégration touche à l'expérience des développeurs. Google a ouvert son Application Design Center (ADC) aux partenaires tiers. L'ADC est un outil visuel dans la console cloud qui permet d'assembler des services Google (Cloud Run, Pub/Sub, BigQuery, etc.) pour créer des applications. Palo Alto a travaillé avec Google pour permettre l'insertion native d'un pare-feu dans ces assemblages. Un développeur qui crée une architecture dans l'ADC peut maintenant ajouter un gabarit Palo Alto d'un clic. Une fois la configuration validée, l'outil génère automatiquement le code Terraform correspondant, incluant les load balancers et le pare-feu. L'objectif est de démocratiser la sécurité réseau en la rendant accessible à des développeurs qui ne maîtrisent pas nécessairement les subtilités des pare-feux d'infrastructure. Collaborateurs Nicolas-Loïc Fortin Nicolas Bédard Crédits Montage par Intrasecure inc Locaux réels par Nicolas Bédard

Cloud Wars Live with Bob Evans
How Gemini Enterprise Is Driving Internal Innovation at KPMG | Cloud Wars Live

Cloud Wars Live with Bob Evans

Play Episode Listen Later May 5, 2026 8:19


At Google Cloud Next in Las Vegas, Cloud Wars Founder Bob Evans sat down with Managing Director for Internal Innovation, KPMG, Aaron Purcell to discuss how KPMG is accelerating AI transformation with Google Cloud. As both a customer and partner of Google Cloud, KPMG offers a unique “client zero” perspective, using Gemini and Vertex AI internally while helping clients do the same. Purcell explains why Google's full-stack AI platform stood out, how governance and speed can coexist, and why employee familiarity with consumer AI tools is changing enterprise adoption faster than ever before. KPMG's AI Playbook The Big Themes: Why Google Won: KPMG evaluated multiple AI providers, but Google Cloud stood apart because it offered what Aaron Purcell called the “full stack.” Instead of piecing together separate providers for models, infrastructure, and agent development, Google delivered an integrated platform that included model creation, cloud services, infrastructure, and a mature agent-building platform through Vertex AI. That end-to-end capability gave KPMG confidence that execution would be faster and more scalable. Consumer AI Accelerates Enterprise Adoption: One of the biggest accelerators for enterprise AI adoption is that employees are already using similar tools at home. Purcell noted that many people already have experience with Google products in their personal lives, making workplace adoption much easier. Tools like NotebookLM and Gemini Enterprise feel intuitive because users recognize the patterns and workflows from consumer applications. Instead of learning entirely new systems, employees translate familiar habits into the workplace. This reduces resistance, shortens training time, and improves confidence. Keeping Up With Vertical Innovation: Purcell said the pace of AI innovation is no longer a hockey stick. It feels like a vertical line. New capabilities are arriving so quickly that organizations need systems to keep employees informed without overwhelming them. KPMG uses Gemini Enterprise itself as a communication platform, with announcement sections highlighting new features and important updates. They also run office hours, user sessions, and collaborative education efforts to keep professionals current. The Big Quote: “We're providing the general user with the ability to create their own agents for personal productivity.” More from Google Cloud and KPMG: Learn more about Google Cloud and KPMG and Google Cloud's alliance. Visit Cloud Wars for more.

The IT Pro Podcast
Google Cloud Next 2026: Scaling AI agents

The IT Pro Podcast

Play Episode Listen Later Apr 24, 2026 21:28


Las Vegas may be known as the city of sin, but in the world of tech it's also the land of conferences. Taking over the Mandalay Bay resort this week was Google Cloud Next, Alphabet's chance to show off the latest in its cloud strategy and – naturally – AI tools.AI agents, in particular, have been a focus this year as Google Cloud looks to meet surging customer demand with infrastructure and software innovations for AI inference.What story has Google been looking to tell at the event? And what's the reality behind it?In this episode, Jane speaks to Rory about some of the key talking points at Google Cloud Next 2026.Read more:'The goal for this year will be to automate all security processes': Google Cloud is betting on Wiz to usher in a new era of AI securityGoogle expands Gemini Enterprise, consolidates Vertex AI services to simplify agent deploymentGoogle Cloud announces eighth-generation TPUs, boasting AI training and inference leapsGoogle Cloud Next 2026: all the live updates as they happenGoogle Cloud Next 2026 is a chance to demonstrate Google's unique advantages

The top AI news from the past week, every ThursdAI

Hey, Alex here, I'll try to catch you up, but it's one of the more intense weeks in AI in recent memory. Here's the TL;DR - OpenAI dominates across the board this week! Finally launches “spud”, called it GPT 5.5 (and 5.5 Pro), and it's SOTA on most things,nearly matching the mysterious Claude Mythos but released and we can actually use it (we tested it extensively). OpenAI also took the crown in image generate with the incredible GPT-image-v2 release, beating Nano Banana 2 and pro by a significant margin, the images are incredible, this model can generate working QR codes and 360 images it's quite bonkers. Codex was updated with Computer Use (which I told you about last week), in-app browser and a bunch of other tools that match GPT 5.5 intelligence. Meanwhile, Anthropic launched an incredible research preview of Claude Design, finally admitted that Claude was dumb and reset quotas across the board, while breaking the trust of the community with removing Claude code from the pro plan. We've also got great open source updates, Kimi K2.6 and Qwen 3.6 27B are both great performers! We were live on the stream for almost 4 hours today waiting for GPT 5.5 and finally got it and tested it live on the show + had Peter Gostev on from Arena who had early access and shared with us his insights. Let's get into it! ThursdAI - Highest signal weekly AI news show is a reader-supported publication. To receive new posts and support my work, consider becoming a free or paid subscriber.OpenAI's GPT 5.5 is here - SOTA AI intelligence you can actually use (Release Blog)OpenAI finally gave us all access to their latest intelligence boost, GPT 5.5 thinking (and GPT 5.5 Pro). These models take the crown across many benchmarks, including TerminalBench (82.7%), GPDval (84%) and more. You can see the highlited versions on the image above. Though, its not uncommon for OpenAI to do some chart crimes, so @d4m1n created a chart that also showed the full benchmarks, including the ones GPT 5.5 is not beating Opus at, as you can see below, it underperforms on Humanity's Last Exam, and scaled tool use. But, benchmarks don't tell the full story. GPT 5.5 uses significantly less tokens, compared to 5.4, about 40% less. It's also more expensive, but given the lower token usage, it nets out at about ~20% price increase, while being more intelligence and faster. Tons of folks who had early access are reporting the same things, this model excels in long running tasks, Peter Gostev from Arena, who joined our live stream, showed us an incredible demo that ran overnight for over 8h! This model can work until the task is done, no longer just pausing in the middel asking for your input. The real highlight is, paired with the recent GPT-image-2 (which I'll expand on later in this newsletter), GPT 5.5 becomes an excellent UI designer. This is a big area in which Claude still has moat and OpenAI is trying to catch up here, and the real alpha now is to use both the Image gen and 5.5 in tandem to create beautiful visuals and UIs. The main thing is, after testing it quite a few times, this only works if you generate an image outside of the session that builds the actual UI. we tried a couple of times to do it in 1 session, and the resulting UI doesn't seem to be remotely close to the generated image. Only after sending this image to a completely fresh session and asking for a “pixel perfect” implementation, did GPT 5.5 start to resemble the input image and rebuild the whole ui in pixel perfect fidelity! GPT Image v2 - SOTA thinking image model, finally beating Nano Banana (Blog, Live)Like we said, OpenAI is dominating this week, and in both instances those are great models. Though, apples to apples comparison, GPT-image-v2 is a much higher jump — from previous models — than GPT 5.5! According to Artificial Analysis, the jump in how many people prefer GPT-image-2 in blind tests compared to other model is the higest we've ever seen, over 250 points. And you can clearly see it in the generations as well. Previously this week, we did a live streaming session with Peter Gostev (from Arena) and we did a deep dive comparing this new model to GPT Image 1.5, Nano Banana and Grok Imagine, and it's a clear winner across most categories.Character consistency is immaculate, high resolution imagery, instruction following, are all so so good it's a bit hard to explain in text. Reasoning visual intelligence Like with Nano Banana, this model is likely based on a big GPT image, it's no longer just diffusion, as you can see, it reasons! And apparently the more reasoning you give it (if you choose GPT pro) the better it'll be. The examples are indeed wild, the model can generate images of code that works, generate functional QR codes and bar codes! The craziest thing people figured out it can do, is functional 360 imagery (equirectangular format), you can just ask the model to create a 360 image of “scene” and then drop this in to a 360 viewer! Peter shows us on the show how he combined GPT 5.5 and Image v2 to create a sort of “street view” from a bunch of 360 images, it blew our minds. He literally spun up an overnight GPT 5.5 task in Codex that planned out the hanging gardens of Babylon, generated hundreds of equirectangular images, stitched them into a walkable interface, and had it running 8+ hours without babysitting. A street view of a place we don't actually know what it looked like, hallucinated from latent space. What a time.Day one availability is wide: Figma, Canva, Adobe Firefly, fal.ai, and Microsoft Foundry all have it. Nano Banana dominated for what felt like an eternity in AI time (it was really only a few months

FLASH DIARIO de El Siglo 21 es Hoy
Nano Banana 2 explicado

FLASH DIARIO de El Siglo 21 es Hoy

Play Episode Listen Later Feb 27, 2026 16:53 Transcription Available


Google mejora generación de imágenes con Gemini 3.1 Flash Image más rápido y consistentePor Félix Riaño @LocutorCoGoogle lanza Nano Banana 2, nuevo modelo de imágenes con más velocidad, texto preciso y hasta resolución 4KAyer hablábamos del nuevo Samsung Galaxy S26 y de cómo integra inteligencia artificial de Google. Hoy vamos a mirar otra pieza de ese mismo ecosistema. Google acaba de lanzar Nano Banana 2, que en realidad se llama Gemini 3.1 Flash Image. Es el nuevo modelo para crear imágenes con inteligencia artificial dentro de la app Gemini, en el buscador y hasta en herramientas de edición de video como Flow.¿Qué cambia frente a la versión anterior? Google promete más velocidad, mejor seguimiento de instrucciones y mayor coherencia cuando aparecen varios personajes en la misma imagen. Además, puede generar imágenes desde 512 píxeles hasta resolución 4K. Y eso abre preguntas importantes: ¿es realmente mejor que Nano Banana Pro? ¿Qué pasa con otras opciones como Midjourney, DALL·E o Firefly?Pero más velocidad trae nuevas dudasNano Banana nació en agosto de 2025 y se volvió viral. En solo cuatro días atrajo a 13 millones de usuarios nuevos a la app Gemini. Para octubre ya había generado más de 5.000 millones de imágenes. Luego llegó Nano Banana Pro en noviembre, con mejor calidad y más control en el texto dentro de las imágenes.Ahora Google combina lo mejor de ambos mundos. Nano Banana 2 usa la arquitectura Gemini 3.1 Flash Image. “Flash” significa rapidez. La idea es generar imágenes casi al instante, pero manteniendo buena calidad. Google dice que puede conservar la identidad de hasta cinco personajes en una misma escena y respetar hasta 14 objetos diferentes sin que cambien de forma o estilo en cada intento. Eso es útil para crear cómics, storyboards o campañas publicitarias donde los personajes deben verse iguales en cada imagen.También mejora la escritura dentro de las imágenes. Por ejemplo, si haces una tarjeta de cumpleaños o un anuncio con texto, ahora las letras salen más legibles y con menos errores.El problema es que cada vez es más difícil distinguir una imagen real de una creada por inteligencia artificial. Herramientas como Nano Banana 2 pueden producir paisajes, retratos y escenas con iluminación realista y texturas muy detalladas. Según encuestas citadas por CNET, la mayoría de personas cree haber visto imágenes hechas con IA, pero menos de la mitad se siente segura de poder identificarlas.Esto afecta redes sociales, campañas políticas, publicidad y hasta tareas escolares. Además, existe el debate sobre derechos de autor. Empresas creativas y estudios de cine han expresado preocupación por el uso de imágenes que podrían basarse en obras protegidas.Google intenta responder a esto con marcas de agua invisibles llamadas SynthID y con credenciales C2PA, un estándar que permite verificar si una imagen fue generada con IA y cómo se creó. Pero esa verificación funciona mejor cuando el contenido viene directamente de herramientas de Google.Al mismo tiempo, la competencia no se queda quieta. OpenAI tiene DALL·E y el generador de video Sora. Midjourney sigue siendo fuerte en arte estilizado. Adobe Firefly apuesta por integración directa con Photoshop y herramientas profesionales. Cada plataforma tiene ventajas distintas en estilo, control o integración empresarial.Nano Banana 2 ya está reemplazando a las versiones anteriores dentro de la app Gemini. En los modos “Fast”, “Thinking” y “Pro” ahora se usará este nuevo modelo por defecto. Los usuarios de planes pagos como Google AI Pro y Ultra podrán seguir accediendo a Nano Banana Pro desde un menú adicional cuando necesiten máxima precisión factual.También se integra en Google Search, en el modo IA y en Google Lens, en 141 países. Está disponible en navegadores de escritorio y móviles, y en herramientas como AI Studio, Vertex AI en Google Cloud y Google Ads. Incluso en Flow, la plataforma de edición de video de Google, ahora es el generador de imágenes predeterminado.La apuesta es clara: Google quiere que la generación de imágenes sea rápida, cotidiana y conectada con información en tiempo real desde el buscador. Eso puede ayudar a crear infografías, diagramas educativos o visualizaciones de datos más exactas.La gran pregunta es si esta velocidad masiva va a aumentar el volumen de imágenes artificiales circulando en internet. Y también si los usuarios aprenderán a verificar lo que ven antes de compartirlo.Nano Banana 2 permite elegir diferentes proporciones de imagen. Puedes crear formato cuadrado para Instagram, vertical para historias o panorámico para pantallas anchas. La resolución máxima es 4K, que equivale a 3.840 por 2.160 píxeles. Eso significa más de 8 millones de píxeles en una sola imagen.Otra mejora es el uso de “conocimiento del mundo” en tiempo real. El modelo puede consultar información actualizada desde el buscador para representar lugares o conceptos con mayor precisión. Por ejemplo, si pides una imagen de un museo específico, puede basarse en referencias visuales reales.En el contexto del Galaxy S26 que mencionamos ayer, esto muestra cómo Google está fortaleciendo todo su ecosistema de IA. El teléfono, el buscador, la app Gemini y las herramientas en la nube comparten modelos cada vez más potentes.Para quienes crean contenido, esto significa menos tiempo editando y más iteraciones rápidas. Para educadores, puede facilitar la creación de material visual didáctico. Para empresas, abre nuevas opciones en publicidad digital automatizada.Pero siempre habrá alternativas. Midjourney suele destacar en arte conceptual. DALL·E se integra con ChatGPT. Adobe Firefly apuesta por entornos profesionales con licencias más controladas. Elegir dependerá de qué necesitas: velocidad, estilo artístico, integración empresarial o control legal.Nano Banana 2 combina rapidez y calidad en la generación de imágenes con IA dentro del ecosistema Google. Mejora texto, coherencia de personajes y resolución hasta 4K. La competencia sigue fuerte y el debate sobre autenticidad continúa. Cuéntame qué opinas y síguenos en Spotify en Flash Diario.BibliografíaTechCrunchArs TechnicaCNBCEngadgetCNETBlog oficial de GoogleConviértete en un supporter de este podcast: https://www.spreaker.com/podcast/flash-diario-de-el-siglo-21-es-hoy--5835407/support.Apoya el Flash Diario y escúchalo sin publicidad en el Club de Supporters. 

The MongoDB Podcast
How to Build Production-Ready AI Agents: MongoDB Atlas + Google Vertex AI

The MongoDB Podcast

Play Episode Listen Later Feb 23, 2026 35:16


In this episode, Michael Lynn (MongoDB) and Yang Li (Google Cloud) break down the architectural blueprint for building intelligent, production-grade applications. Move beyond simple RAG (Retrieval-Augmented Generation) and explore the world of AI Agents.What you'll learn:The Google Cloud AI stack: Vertex AI, Agent Space, and Model Garden.Deep-dive integration: Connecting MongoDB Atlas with BigQuery and Dataflow.Real-world Demo: Building a grocery store AI assistant using Gemini and Vector Search.Startup Perks: How to access up to $350k in Google Cloud credits and $10k in MongoDB credits.

Cloud Wars Live with Bob Evans
Google Cloud, Unilever Create AI-Powered Marketing for AI Economy

Cloud Wars Live with Bob Evans

Play Episode Listen Later Feb 23, 2026 5:19


In today's Cloud Wars Minute, I examine how AI-powered partnerships are redefining growth and desirability in the consumer economy. Highlights 00:15 — I want to talk today about how Google Cloud, the number one company on the Cloud Wars Top 10, has partnered up with its longtime customer, Unilever, to develop what I'm calling an AI-powered marketing and fulfillment engine for the AI economy. 00:59 — The focus about AI on large language models and tokens is incredibly important, but not the end goal. The end goal is the business outcome. And I think this is a very healthy thing to see the conversation shift from being heavily focused on the technology to being focused on the desired business outcomes. 02:07 — They said, we are working together in this partnership to create a new model for how consumer packaged goods brands are discovered and shopped. How consumers find them, look for them, shop for them, pay for them, and create growth for these companies. Technology has moved to the core of value creation. 02:52 — Consumers are going to be looking for, finding, and engaging with products via AI. [Unilever's Head of Supply Chain and Operations] said, we now have to be the company that presents them our products, services, possibility, our value to them in the AI context. This goes beyond a tech vendor supplying products and services to a big customer. 03:50 — They're going to use all of Google's vast AI portfolio, from Vertex AI to Gemini on the model side, so from platform to model. They're going to move a lot of Unilever's enterprise applications and data platform over to Google Cloud to allow this better end-to-end capability. Visit Cloud Wars for more.

The Data Engineering Show
The Geo-Data Problem Nobody Talks About And How Voi Solved It ft. Magnus Dahlbäck

The Data Engineering Show

Play Episode Listen Later Feb 19, 2026 16:06


What if your data platform could power both critical business decisions and real-time product features at scale? In this episode, host Benjamin sits down with Magnus Dahlbäck, Senior Director of Data and Platform at Voi, to explore how a metrics-first approach and semantic layers transform data accessibility, why traditional ML and LLMs require different strategies for different problems, and how to balance FinOps costs while processing billions of IoT events daily. Whether you're building data infrastructure for a high-growth company or rethinking how your organization consumes data, this conversation is packed with practical strategies for unlocking data value and preparing your platform for AI. Tune in to discover how Voi ditched traditional BI tools and revolutionized their approach to enterprise analytics.

Two Voice Devs
Episode 268 - The New @langchain/google Package

Two Voice Devs

Play Episode Listen Later Feb 19, 2026 18:07


Allen has been busy! This week, he unveils the new `@langchain/google` package for LangChain JS. This major update consolidates five previous libraries into a single, standardized, and powerful tool for developers working with Gemini and Vertex AI. Allen walks Mark through the motivation behind the change, the focus on backward compatibility, and the exciting new features like simplified multimodal input/output and text-to-speech support. If you're building with Google AI and JavaScript, this is the update you've been waiting for.[00:00:57] The confusion of previous packages[00:02:52] Creating a unified package[00:03:45] Introducing @langchain/google[00:04:35] Backward compatibility[00:06:48] Multimodal inputs[00:07:54] Standardizing output and image generation[00:08:58] Text-to-Speech support[00:11:29] Simplifying parameters and reasoning[00:14:55] Future roadmap#LangChain #Gemini #NanoBanana #TextToSpeech #GoogleAI #JavaScript #TypeScript #VertexAI #OpenSource #AI #WebDevelopment #TwoVoiceDevs

Cloud Wars Live with Bob Evans
Salesforce Takes On Agent Sprawl With MuleSoft Agent Fabric

Cloud Wars Live with Bob Evans

Play Episode Listen Later Feb 6, 2026 2:53


In today's Cloud Wars Minute, I explain why agent sprawl may become one of the biggest hidden risks of the AI Era.Highlights00:03 — The massive increase in the adoption of agentic AI technology will have significant consequences for businesses. There'll be increased productivity, the ability to reskill employees who have more time to focus on other areas of the business, and opportunities to explore new business ideas and avenues.00:32 — And something else — a surge in the number of AI agents, millions, millions, and millions of them. All of these agents lead to a phenomenon called agent sprawl. So if data sprawl is diesel-driven, think of agent sprawl as running on jet fuel. Without proper governance and visibility, this can lead to shadow AI, which, in the wrong hands, could effectively bring down a business.01:04 — To avoid this, Salesforce has added automated discovery for AI agents and tools to MuleSoft Agent Fabric. Andrew Comstock, SVP and GM of MuleSoft at Salesforce, said "The expanded capabilities give you the freedom to innovate across any platform while maintaining the unified visibility and control needed to scale."01:32 — At the core of these enhancements are agent scanners, which automatically detect and catalog AI agents across Salesforce Agentforce, Amazon Bedrock, Google Cloud's Vertex AI, and other authorized AI platforms. Additionally, for MCP services and other bespoke agents, MuleSoft Agent Fabric facilitates easy integration across a company's entire agent ecosystem.02:01 — The recent updates replace manual oversight with automation, enhance security by providing instant visibility into multi-cloud agents, highlight internal tools that may otherwise be overlooked, and offer a unified agent map to identify areas for optimizing AI investments. Visit Cloud Wars for more.

The Cloud Pod
333: The Cloud Pod Goes Nano Banana

The Cloud Pod

Play Episode Listen Later Dec 2, 2025 62:32


Welcome to episode 333 of The Cloud Pod, where the forecast is always cloudy! Justin, Ryan, and Matt are taking a quick break from re:Invent festivities. They bring you the latest and greatest in Cloud and AI news. This week, we discuss Norad and Anthropic teaming up to bring you Christmas cheer. Wait, is that right? Huh. We also have undersea cables, some Turkish region delight, and a LOT of Opus 4.5 news. Let's get into it! Titles we almost went with this week Boring Error Pages Not Found Claude Goes Native in Snowflake: Finally, AI That Stays Where Your Data Lives Cross-Cloud Romance: AWS and Google Make It Official with Interconnect Google Gemini Puts OpenAI in Code Red: The Tables Have Turned Azure NAT Gateway V2: Now With More Zones Than a Parking Lot From ChatGPT to Chat-Uh-Oh: OpenAI Sounds the Alarm as Gemini Steals 200 Million Users Scheduled Actions: Because Your VMs Need a Work-Life Balance Too Finally, Your 500 Errors Can Look as Good as Your Homepage Foundry Model Router: Because Choosing Between 47 AI Models is Nobody’s Idea of Fun Google Takes the Scenic Route: New Cable Avoids the Sunda Strait Traffic Jam Azure Application Gateway Gets Its TCP/IP Diploma Google Cloud Gets Its Türkiye Dinner: 2 Billion Dollar Cloud Feast Coming Soon Microsoft Foundry: Turning AI Chaos into Compliance Gold AI Is Going Great, or How ML Makes Money  02:59 Nano Banana Pro available for enterprise Google launches Nano Banana Pro (Gemini 3 Pro Image) in general availability on Vertex AI and Google Workspace, with Gemini Enterprise support coming soon. The model supports up to 14 reference images for style consistency and generates 4K resolution outputs with multilingual text rendering capabilities. The model includes Google Search grounding for factual accuracy in generated infographics and diagrams, plus built-in SynthID watermarking for transparency. Copyright indemnification will be available at general availability under Google’s shared responsibility framework. Enterprise integrations are live with Adobe Firefly, Photoshop, Canva, and Figma, enabling production-grade creative workflows. Major retailers, including Klarna, Shopify, and Wayfair, report using the model for product visualization and marketing asset generation at scale. Developers can access Nano Banana Pro through Vertex AI with Provis

The Data Engineering Show
60 Billion Predictions Daily: Inside Credit Karma's Agentic Data Layer with Maddie Daianu

The Data Engineering Show

Play Episode Listen Later Nov 19, 2025 19:55


What does MLOps look like when you are deploying 22,000 models a month? Maddie Daianu, Head of Data and AI at Intuit Credit Karma, joins the Data Bros to pull back the curtain on one of the most high-volume data environments in FinTech. With a 100-person team serving 140 million members, standard data practices break down. Maddie shares how her team manages terabytes of daily data on Google Cloud and explains the massive strategic pivot they are undertaking right now: The move from "Information" to "Agency."

AI for Non-Profits
Google Maps Levels Up with AI: What You Need to Know

AI for Non-Profits

Play Episode Listen Later Nov 18, 2025 9:58


Join Jaeden and Jamie as they explore Google Maps' new AI-powered features, including Gemini and Vertex AI integrations. Learn how these updates improve user experience while offering powerful new ways for businesses to optimize their Google presence.Our Skool Community: https://www.skool.com/aihustleGet the top 40+ AI Models for $20 at AI Box: https://aibox.aiSee Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

AI Hustle: News on Open AI, ChatGPT, Midjourney, NVIDIA, Anthropic, Open Source LLMs

Explore the latest AI advancements in Google Maps, including interactive features and tools like Vertex AI and Gemini. Discover how these innovations can enhance user experience and benefit businesses, with insights from Jamie and Jaeden on optimizing Google listings and leveraging AI for growth.Our Skool Community: https://www.skool.com/aihustleGet the top 40+ AI Models for $20 at AI Box: ⁠⁠https://aibox.aiSee Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

The Cloud Pod
327: AWS Finally Admits Kubernetes is Hard, Makes Robots Do It Instead

The Cloud Pod

Play Episode Listen Later Oct 21, 2025 74:55


Welcome to episode 327 of The Cloud Pod, where the forecast is always cloudy! Justin, Matt, and Ryan are here to bring you all the latest news (and a few rants) in the worlds of Cloud and AI. I'm sure all our readers are aware of the AWS outage last week, as it was in all the news everywhere. But we've also got some new AI models (including Sora in case you're low on really crappy videos the youths might like), plus EKS, Kubernetes, Vertex AI, and more. Let's get started!  Titles we almost went with this week Oracle and Azure Walk Into a Cloud Bar: Nobody Gets ETL’d When DNS Goes Down, So Does Your Monday: AWS Takes Half the Internet on a Coffee Break 404 Cloud Not Found: AWS Proves Even the Internet’s Phone Book Can Get Lost DNS: Definitely Not Staffed – How AWS Lost Its Way When It Lost Its People When Larry Met Satya: A Cloud Love Story Azure Finally Answers ‘Dude, Where’s My Data?’ with Storage Discovery Breaking: Microsoft Discovers AI Training Uses More Power Than a Small Country 404 Engineers Not Found – AWS Learns the Hard Way That People Are Its Most Critical Infrastructure Azure Storage Discovery: Finding Your Data Needles in the Cloud Haystack EKS Auto Mode: Because Even Your Clusters Deserve Cruise Control Azure Gets Reel: Microsoft Adds Video Generation to AI Foundry The Great Token Heist: Vertex AI Steals 90% Off Your Gemini Bills Cache Me If You Can: Vertex AI’s Token-Saving Feature IaC Just Got a Manager – And It’s Not Your Boss  From Musk to Microsoft: Grok 4 Makes the Great Cloud Migration No Harness.. You are not going to make IACM happen Microsoft Drafts a Solution to Container Creation Chaos PowerShell to the People: Azure Simplifies the Great Gateway Migration IP There Yet? Azure’s Scripts Keep Your Address While You Upgrade Follow Up 00:53 Glacier Deprecation Email Standalone Amazon Glacier service (vault-based with separate APIs) will stop accepting new customers as of December 15, 2025.  S3 Glacier storage classes (Instant Retrieval, Flexible Retrieval, Deep Archive) are completely unaffected and continue normally Existing Glacier customers can keep using it forever – no forced migration required.  AWS is essentially consolidating around S3 as the unified storage platform, rather than maintaining two separate archival services. The standalone service will enter maintenance mode, meaning there will be no new features, but the service will remain operational. Migration to S3 Glacier is optional but recommended for better integration, lower costs, and more features. (Justin assures us it is actually slightly cheaper, so there's that.)  General News  02:24

Everyday AI Podcast – An AI and ChatGPT Podcast
Ep 635: ChatGPT & Wal-Mart team up for AI shopping, Google drops Veo 3.1, Claude Skills get released & more

Everyday AI Podcast – An AI and ChatGPT Podcast

Play Episode Listen Later Oct 20, 2025 36:07


AI Unraveled: Latest AI News & Trends, Master GPT, Gemini, Generative AI, LLMs, Prompting, GPT Store
ACE the Google Cloud Professional Machine Learning Engineer Exam

AI Unraveled: Latest AI News & Trends, Master GPT, Gemini, Generative AI, LLMs, Prompting, GPT Store

Play Episode Listen Later Oct 15, 2025 19:34


Welcome to AI Unraveled, your daily briefing on the real world business impact of AI.Are you preparing for the challenging Google Cloud Professional Machine Learning Engineer certification? This episode is your secret weapon! In less than 18 minutes, we deliver a rapid-fire guided study session packed with 10 exam-style practice questions and actionable "study hacks" to lock in the key concepts.We cut through the complexity of Google's powerful AI services, focusing on core topics like MLOps with Vertex AI, large-scale data processing with Dataflow, and feature engineering in BigQuery. This isn't just a Q&A; it's a focused training session designed to help you think like a certified Google Cloud ML expert and ace your exam.In This Episode, You'll Learn:ML Problem Framing: How to instantly tell the difference between a regression and a classification problem.Data Preprocessing: When to use Dataflow for unstructured data vs. BigQuery for structured data.Feature Engineering: The best practice for handling high-cardinality categorical features in a neural network.Vertex AI Training: The critical decision point between using a pre-built or a custom training container.Hyperparameter Tuning: How to use Vertex AI Vizier efficiently when you're on a limited budget.Model Deployment: The key differences between online and batch prediction for real-world applications.MLOps Automation: How to orchestrate a complete, reproducible workflow with Vertex AI Pipelines.Model Monitoring: How to spot and diagnose training-serving skew to maintain model performance.Responsible AI: Using the What-If Tool to investigate model fairness and mitigate bias.Serverless Architecture: A simple, powerful pattern for building event-driven ML systems with Cloud Functions.

Analyse Asia with Bernard Leong
Agent Bricks and How Data-AI Integration Changes Everything with Craig Wiley

Analyse Asia with Bernard Leong

Play Episode Listen Later Sep 26, 2025 27:53


"85% of AI use cases are being evaluated by the engineer who built it saying, 'yep, seemed to work pretty well.' If you're gonna build a system that's going to be critical to the business, that's going to be important that it gets it right, then you can't do that without evaluations." - Craig Wiley Fresh out of the studio, Craig Wiley, Senior Director of Product Management at Databricks who leads Mosaic AI, joins us to discuss the forefront of enterprise AI from model development to deployment at scale. Beginning with his career journey in ML operations, Craig explained how he recognized the critical connection between data and AI layers that could deliver order-of-magnitude acceleration in development cycles. Emphasizing the transition from classical ML operations to LLM operations, he showcased how Databricks' unified platform eliminates training-serving skew through data lineage capabilities and supports both fine-tuning and RAG approaches depending on industrial use case requirements. Highlighting compelling customer success stories including Suncorp's employee productivity platform and AstraZeneca's transformation of 400,000 clinical trial documents into queryable insights, Craig revealed a striking reality about enterprise AI evaluation - that 85% of AI use cases are being evaluated only by the engineers who built them, reinforcing that proper evaluation frameworks remain foundational for trustworthy AI implementation. He concluded by introducing Agent Bricks as Databricks' evaluation-centric approach to building production agents, emphasizing that model flexibility and rigorous testing are essential for enterprises moving from experimentation to production, while sharing his vision that the industry must evolve from the "year of agents" to the "year of evaluation and quality." Episode Highlights: [00:00] Quote of the Day by Craig Wiley [01:21] How Craig Wiley started his work in ML Ops that led him to Databricks [02:43] Data and AI layer connection creates order-of-magnitude acceleration [03:47] Mosaic AI acquisition expanded Gen AI solution capabilities [04:38] Classical ML statistics versus Gen AI evaluation challenges [05:48] Mosaic AI covers end-to-end from data ingestion [07:12] Training-serving skew eliminated through unified platform lineage [08:51] Fine tuning versus RAG depends on use case [10:49] Industrial agents benefit from fine-tuned smaller models [12:44] Common governance scheme covers tables through model access [13:52] Agent Bricks prioritizes accuracy over simplicity alone [15:44] Model flexibility crucial for speed and accuracy optimization [16:54] AB testing different models shows immediate performance differences [17:59] Suncorp and AstraZeneca demonstrate diverse AI applications [19:37] Asia Pacific shows aggressive AI adoption strategies [20:59] CFO approval requires proven agent effectiveness evaluation [22:00] 85% of AI cases evaluated only by building engineer [23:20] Model agnostic approach beats single-vendor AI strategies [24:12] Industry terminology evolves rapidly from RAG to agents [25:39] Customer creativity with governance capabilities inspires product development Profile: Craig Wiley, Senior Director of Product Management at Databricks and Mosaic AI LinkedIn: https://www.linkedin.com/in/craigwiley/ Podcast Information: Bernard Leong hosts and produces the show. The proper credits for the intro and end music are "Energetic Sports Drive." G. Thomas Craig mixed and edited the episode in both video and audio format. Here are the links to watch or listen to our podcast. Analyse Asia Main Site: https://analyse.asia Analyse Asia Spotify: https://open.spotify.com/show/1kkRwzRZa4JCICr2vm0vGl Analyse Asia Apple Podcasts: https://podcasts.apple.com/us/podcast/analyse-asia-with-bernard-leong/id914868245 Analyse Asia LinkedIn: https://www.linkedin.com/company/analyse-asia/ Analyse Asia X (formerly known as Twitter): https://twitter.com/analyseasia Sign Up for Our This Week in Asia Newsletter: https://www.analyse.asia/#/portal/signup Subscribe Newsletter on LinkedIn https://www.linkedin.com/build-relation/newsletter-follow?entityUrn=7149559878934540288

Eccles Business Buzz
RERUN: S7E9. Using AI Agents and Models Effectively feat. Derek Egan

Eccles Business Buzz

Play Episode Listen Later Aug 14, 2025 27:16


As we prepare for a brand new season of Eccles Business Buzz launching this fall, we're bringing back some of your favorite episodes from our archive. In this series of conversations from Season 7 about Artificial Intelligence and how it's changing the world around us, Frances talks to an AI engineer at Google about the ins and outs of the newest crop of AI models and agents.Joining the show to give an insider's perspective is Derek Egan. Derek is on the Vertex AI team at Google Cloud where he works on helping developers build generative AI-powered agents for their own applications. Derek is also a graduate of the David Eccles School of Business with a degree in Operations Management. David and Frances discuss the difference between models and agents, and why humans are still very much integral to the process. They address the strengths and weaknesses of these types of systems and the ways in which they might be used by organizations most effectively to help them work more efficiently. Derek speaks to the realistic worries of some AI critics and gives some of his own real-life examples of how AI agents help streamline his work life and personal life. Eccles Business Buzz is a production of the David Eccles School of Business and is produced by University fm.Show Links:Derek Egan | LinkedInVertex AI | Google CloudMaster of Science in Business Analytics - The David Eccles School of BusinessDavid Eccles School of Business (@ubusiness) • InstagramEccles Alumni Network (@ecclesalumni) • Instagram Eccles Experience Magazine

Les Cast Codeurs Podcast
LCC 329 - L'IA, ce super stagiaire qui nous fait travailler plus

Les Cast Codeurs Podcast

Play Episode Listen Later Aug 14, 2025 120:24


Arnaud et Guillaume explore l'évolution de l'écosystème Java avec Java 25, Spring Boot et Quarkus, ainsi que les dernières tendances en intelligence artificielle avec les nouveaux modèles comme Grok 4 et Claude Code. Les animateurs font également le point sur l'infrastructure cloud, les défis MCP et CLI, tout en discutant de l'impact de l'IA sur la productivité des développeurs et la gestion de la dette technique. Enregistré le 8 août 2025 Téléchargement de l'épisode LesCastCodeurs-Episode–329.mp3 ou en vidéo sur YouTube. News Langages Java 25: JEP 515 : Profilage de méthode en avance (Ahead-of-Time) https://openjdk.org/jeps/515 Le JEP 515 a pour but d'améliorer le temps de démarrage et de chauffe des applications Java. L'idée est de collecter les profils d'exécution des méthodes lors d'une exécution antérieure, puis de les rendre immédiatement disponibles au démarrage de la machine virtuelle. Cela permet au compilateur JIT de générer du code natif dès le début, sans avoir à attendre que l'application soit en cours d'exécution. Ce changement ne nécessite aucune modification du code des applications, des bibliothèques ou des frameworks. L'intégration se fait via les commandes de création de cache AOT existantes. Voir aussi https://openjdk.org/jeps/483 et https://openjdk.org/jeps/514 Java 25: JEP 518 : Échantillonnage coopératif JFR https://openjdk.org/jeps/518 Le JEP 518 a pour objectif d'améliorer la stabilité et l'évolutivité de la fonction JDK Flight Recorder (JFR) pour le profilage d'exécution. Le mécanisme d'échantillonnage des piles d'appels de threads Java est retravaillé pour s'exécuter uniquement à des safepoints, ce qui réduit les risques d'instabilité. Le nouveau modèle permet un parcours de pile plus sûr, notamment avec le garbage collector ZGC, et un échantillonnage plus efficace qui prend en charge le parcours de pile concurrent. Le JEP ajoute un nouvel événement, SafepointLatency, qui enregistre le temps nécessaire à un thread pour atteindre un safepoint. L'approche rend le processus d'échantillonnage plus léger et plus rapide, car le travail de création de traces de pile est délégué au thread cible lui-même. Librairies Spring Boot 4 M1 https://spring.io/blog/2025/07/24/spring-boot–4–0–0-M1-available-now Spring Boot 4.0.0-M1 met à jour de nombreuses dépendances internes et externes pour améliorer la stabilité et la compatibilité. Les types annotés avec @ConfigurationProperties peuvent maintenant référencer des types situés dans des modules externes grâce à @ConfigurationPropertiesSource. Le support de l'information sur la validité des certificats SSL a été simplifié, supprimant l'état WILL_EXPIRE_SOON au profit de VALID. L'auto-configuration des métriques Micrometer supporte désormais l'annotation @MeterTag sur les méthodes annotées @Counted et @Timed, avec évaluation via SpEL. Le support de @ServiceConnection pour MongoDB inclut désormais l'intégration avec MongoDBAtlasLocalContainer de Testcontainers. Certaines fonctionnalités et API ont été dépréciées, avec des recommandations pour migrer les points de terminaison personnalisés vers les versions Spring Boot 2. Les versions milestones et release candidates sont maintenant publiées sur Maven Central, en plus du repository Spring traditionnel. Un guide de migration a été publié pour faciliter la transition depuis Spring Boot 3.5 vers la version 4.0.0-M1. Passage de Spring Boot à Quarkus : retour d'expérience https://blog.stackademic.com/we-switched-from-spring-boot-to-quarkus-heres-the-ugly-truth-c8a91c2b8c53 Une équipe a migré une application Java de Spring Boot vers Quarkus pour gagner en performances et réduire la consommation mémoire. L'objectif était aussi d'optimiser l'application pour le cloud natif. La migration a été plus complexe que prévu, notamment à cause de l'incompatibilité avec certaines bibliothèques et d'un écosystème Quarkus moins mature. Il a fallu revoir du code et abandonner certaines fonctionnalités spécifiques à Spring Boot. Les gains en performances et en mémoire sont réels, mais la migration demande un vrai effort d'adaptation. La communauté Quarkus progresse, mais le support reste limité comparé à Spring Boot. Conclusion : Quarkus est intéressant pour les nouveaux projets ou ceux prêts à être réécrits, mais la migration d'un projet existant est un vrai défi. LangChain4j 1.2.0 : Nouvelles fonctionnalités et améliorations https://github.com/langchain4j/langchain4j/releases/tag/1.2.0 Modules stables : Les modules langchain4j-anthropic, langchain4j-azure-open-ai, langchain4j-bedrock, langchain4j-google-ai-gemini, langchain4j-mistral-ai et langchain4j-ollama sont désormais en version stable 1.2.0. Modules expérimentaux : La plupart des autres modules de LangChain4j sont en version 1.2.0-beta8 et restent expérimentaux/instables. BOM mis à jour : Le langchain4j-bom a été mis à jour en version 1.2.0, incluant les dernières versions de tous les modules. Principales améliorations : Support du raisonnement/pensée dans les modèles. Appels d'outils partiels en streaming. Option MCP pour exposer automatiquement les ressources en tant qu'outils. OpenAI : possibilité de définir des paramètres de requête personnalisés et d'accéder aux réponses HTTP brutes et aux événements SSE. Améliorations de la gestion des erreurs et de la documentation. Filtering Metadata Infinispan ! (cc Katia( Et 1.3.0 est déjà disponible https://github.com/langchain4j/langchain4j/releases/tag/1.3.0 2 nouveaux modules expérimentaux, langchain4j-agentic et langchain4j-agentic-a2a qui introduisent un ensemble d'abstractions et d'utilitaires pour construire des applications agentiques Infrastructure Cette fois c'est vraiment l'année de Linux sur le desktop ! https://www.lesnumeriques.com/informatique/c-est-enfin-arrive-linux-depasse-un-seuil-historique-que-microsoft-pensait-intouchable-n239977.html Linux a franchi la barre des 5% aux USA Cette progression s'explique en grande partie par l'essor des systèmes basés sur Linux dans les environnements professionnels, les serveurs, et certains usages grand public. Microsoft, longtemps dominant avec Windows, voyait ce seuil comme difficilement atteignable à court terme. Le succès de Linux est également alimenté par la popularité croissante des distributions open source, plus légères, personnalisables et adaptées à des usages variés. Le cloud, l'IoT, et les infrastructures de serveurs utilisent massivement Linux, ce qui contribue à cette augmentation globale. Ce basculement symbolique marque un changement d'équilibre dans l'écosystème des systèmes d'exploitation. Toutefois, Windows conserve encore une forte présence dans certains segments, notamment chez les particuliers et dans les entreprises classiques. Cette évolution témoigne du dynamisme et de la maturité croissante des solutions Linux, devenues des alternatives crédibles et robustes face aux offres propriétaires. Cloud Cloudflare 1.1.1.1 s'en va pendant une heure d'internet https://blog.cloudflare.com/cloudflare–1–1–1–1-incident-on-july–14–2025/ Le 14 juillet 2025, le service DNS public Cloudflare 1.1.1.1 a subi une panne majeure de 62 minutes, rendant le service indisponible pour la majorité des utilisateurs mondiaux. Cette panne a aussi causé une dégradation intermittente du service Gateway DNS. L'incident est survenu suite à une mise à jour de la topologie des services Cloudflare qui a activé une erreur de configuration introduite en juin 2025. Cette erreur faisait que les préfixes destinés au service 1.1.1.1 ont été accidentellement inclus dans un nouveau service de localisation des données (Data Localization Suite), ce qui a perturbé le routage anycast. Le résultat a été une incapacité pour les utilisateurs à résoudre les noms de domaine via 1.1.1.1, rendant la plupart des services Internet inaccessibles pour eux. Ce n'était pas le résultat d'une attaque ou d'un problème BGP, mais une erreur interne de configuration. Cloudflare a rapidement identifié la cause, corrigé la configuration et mis en place des mesures pour prévenir ce type d'incident à l'avenir. Le service est revenu à la normale après environ une heure d'indisponibilité. L'incident souligne la complexité et la sensibilité des infrastructures anycast et la nécessité d'une gestion rigoureuse des configurations réseau. Web L'évolution des bonnes pratiques de Node.js https://kashw1n.com/blog/nodejs–2025/ Évolution de Node.js en 2025 : Le développement se tourne vers les standards du web, avec moins de dépendances externes et une meilleure expérience pour les développeurs. ES Modules (ESM) par défaut : Remplacement de CommonJS pour un meilleur outillage et une standardisation avec le web. Utilisation du préfixe node: pour les modules natifs afin d'éviter les conflits. API web intégrées : fetch, AbortController, et AbortSignal sont maintenant natifs, réduisant le besoin de librairies comme axios. Runner de test intégré : Plus besoin de Jest ou Mocha pour la plupart des cas. Inclut un mode “watch” et des rapports de couverture. Patterns asynchrones avancés : Utilisation plus poussée de async/await avec Promise.all() pour le parallélisme et les AsyncIterators pour les flux d'événements. Worker Threads pour le parallélisme : Pour les tâches lourdes en CPU, évitant de bloquer l'event loop principal. Expérience de développement améliorée : Intégration du mode --watch (remplace nodemon) et du support --env-file (remplace dotenv). Sécurité et performance : Modèle de permission expérimental pour restreindre l'accès et des hooks de performance natifs pour le monitoring. Distribution simplifiée : Création d'exécutables uniques pour faciliter le déploiement d'applications ou d'outils en ligne de commande. Sortie de Apache EChart 6 après 12 ans ! https://echarts.apache.org/handbook/en/basics/release-note/v6-feature/ Apache ECharts 6.0 : Sortie officielle après 12 ans d'évolution. 12 mises à niveau majeures pour la visualisation de données. Trois dimensions clés d'amélioration : Présentation visuelle plus professionnelle : Nouveau thème par défaut (design moderne). Changement dynamique de thème. Prise en charge du mode sombre. Extension des limites de l'expression des données : Nouveaux types de graphiques : Diagramme de cordes (Chord Chart), Nuage de points en essaim (Beeswarm Chart). Nouvelles fonctionnalités : Jittering pour nuages de points denses, Axes coupés (Broken Axis). Graphiques boursiers améliorés Liberté de composition : Nouveau système de coordonnées matriciel. Séries personnalisées améliorées (réutilisation du code, publication npm). Nouveaux graphiques personnalisés inclus (violon, contour, etc.). Optimisation de l'agencement des étiquettes d'axe. Data et Intelligence Artificielle Grok 4 s'est pris pour un nazi à cause des tools https://techcrunch.com/2025/07/15/xai-says-it-has-fixed-grok–4s-problematic-responses/ À son lancement, Grok 4 a généré des réponses offensantes, notamment en se surnommant « MechaHitler » et en adoptant des propos antisémites. Ce comportement provenait d'une recherche automatique sur le web qui a mal interprété un mème viral comme une vérité. Grok alignait aussi ses réponses controversées sur les opinions d'Elon Musk et de xAI, ce qui a amplifié les biais. xAI a identifié que ces dérapages étaient dus à une mise à jour interne intégrant des instructions encourageant un humour offensant et un alignement avec Musk. Pour corriger cela, xAI a supprimé le code fautif, remanié les prompts système, et imposé des directives demandant à Grok d'effectuer une analyse indépendante, en utilisant des sources diverses. Grok doit désormais éviter tout biais, ne plus adopter un humour politiquement incorrect, et analyser objectivement les sujets sensibles. xAI a présenté ses excuses, précisant que ces dérapages étaient dus à un problème de prompt et non au modèle lui-même. Cet incident met en lumière les défis persistants d'alignement et de sécurité des modèles d'IA face aux injections indirectes issues du contenu en ligne. La correction n'est pas qu'un simple patch technique, mais un exemple des enjeux éthiques et de responsabilité majeurs dans le déploiement d'IA à grande échelle. Guillaume a sorti toute une série d'article sur les patterns agentiques avec le framework ADK pour Java https://glaforge.dev/posts/2025/07/29/mastering-agentic-workflows-with-adk-the-recap/ Un premier article explique comment découper les tâches en sous-agents IA : https://glaforge.dev/posts/2025/07/23/mastering-agentic-workflows-with-adk-sub-agents/ Un deuxième article détaille comment organiser les agents de manière séquentielle : https://glaforge.dev/posts/2025/07/24/mastering-agentic-workflows-with-adk-sequential-agent/ Un troisième article explique comment paralleliser des tâches indépendantes : https://glaforge.dev/posts/2025/07/25/mastering-agentic-workflows-with-adk-parallel-agent/ Et enfin, comment faire des boucles d'amélioration : https://glaforge.dev/posts/2025/07/28/mastering-agentic-workflows-with-adk-loop-agents/ Tout ça évidemment en Java :slightly_smiling_face: 6 semaines de code avec Claude https://blog.puzzmo.com/posts/2025/07/30/six-weeks-of-claude-code/ Orta partage son retour après 6 semaines d'utilisation quotidienne de Claude Code, qui a profondément changé sa manière de coder. Il ne « code » plus vraiment ligne par ligne, mais décrit ce qu'il veut, laisse Claude proposer une solution, puis corrige ou ajuste. Cela permet de se concentrer sur le résultat plutôt que sur l'implémentation, comme passer de la peinture au polaroid. Claude s'avère particulièrement utile pour les tâches de maintenance : migrations, refactors, nettoyage de code. Il reste toujours en contrôle, révise chaque diff généré, et guide l'IA via des prompts bien cadrés. Il note qu'il faut quelques semaines pour prendre le bon pli : apprendre à découper les tâches et formuler clairement les attentes. Les tâches simples deviennent quasi instantanées, mais les tâches complexes nécessitent encore de l'expérience et du discernement. Claude Code est vu comme un très bon copilote, mais ne remplace pas le rôle du développeur qui comprend l'ensemble du système. Le gain principal est une vitesse de feedback plus rapide et une boucle d'itération beaucoup plus courte. Ce type d'outil pourrait bien redéfinir la manière dont on pense et structure le développement logiciel à moyen terme. Claude Code et les serveurs MCP : ou comment transformer ton terminal en assistant surpuissant https://touilleur-express.fr/2025/07/27/claude-code-et-les-serveurs-mcp-ou-comment-transformer-ton-terminal-en-assistant-surpuissant/ Nicolas continue ses études sur Claude Code et explique comment utiliser les serveurs MCP pour rendre Claude bien plus efficace. Le MCP Context7 montre comment fournir à l'IA la doc technique à jour (par exemple, Next.js 15) pour éviter les hallucinations ou les erreurs. Le MCP Task Master, autre serveur MCP, transforme un cahier des charges (PRD) en tâches atomiques, estimées, et organisées sous forme de plan de travail. Le MCP Playwright permet de manipuler des navigateurs et d'executer des tests E2E Le MCP Digital Ocean permet de déployer facilement l'application en production Tout n'est pas si ideal, les quotas sont atteints en quelques heures sur une petite application et il y a des cas où il reste bien plus efficace de le faire soit-même (pour un codeur expérimenté) Nicolas complète cet article avec l'écriture d'un MVP en 20 heures: https://touilleur-express.fr/2025/07/30/comment-jai-code-un-mvp-en-une-vingtaine-dheures-avec-claude-code/ Le développement augmenté, un avis politiquement correct, mais bon… https://touilleur-express.fr/2025/07/31/le-developpement-augmente-un-avis-politiquement-correct-mais-bon/ Nicolas partage un avis nuancé (et un peu provoquant) sur le développement augmenté, où l'IA comme Claude Code assiste le développeur sans le remplacer. Il rejette l'idée que cela serait « trop magique » ou « trop facile » : c'est une évolution logique de notre métier, pas un raccourci pour les paresseux. Pour lui, un bon dev reste celui qui structure bien sa pensée, sait poser un problème, découper, valider — même si l'IA aide à coder plus vite. Il raconte avoir codé une app OAuth, testée, stylisée et déployée en quelques heures, sans jamais quitter le terminal grâce à Claude. Ce genre d'outillage change le rapport au temps : on passe de « je vais y réfléchir » à « je tente tout de suite une version qui marche à peu près ». Il assume aimer cette approche rapide et imparfaite : mieux vaut une version brute livrée vite qu'un projet bloqué par le perfectionnisme. L'IA est selon lui un super stagiaire : jamais fatigué, parfois à côté de la plaque, mais diablement productif quand bien briefé. Il conclut que le « dev augmenté » ne remplace pas les bons développeurs… mais les développeurs moyens doivent s'y mettre, sous peine d'être dépassés. ChatGPT lance le mode d'étude : un apprentissage interactif pas à pas https://openai.com/index/chatgpt-study-mode/ OpenAI propose un mode d'étude dans ChatGPT qui guide les utilisateurs pas à pas plutôt que de donner directement la réponse. Ce mode vise à encourager la réflexion active et l'apprentissage en profondeur. Il utilise des instructions personnalisées pour poser des questions et fournir des explications adaptées au niveau de l'utilisateur. Le mode d'étude favorise la gestion de la charge cognitive et stimule la métacognition. Il propose des réponses structurées pour faciliter la compréhension progressive des sujets. Disponible dès maintenant pour les utilisateurs connectés, ce mode sera intégré dans ChatGPT Edu. L'objectif est de transformer ChatGPT en un véritable tuteur numérique, aidant les étudiants à mieux assimiler les connaissances. A priori Gemini viendrait de sortir un fonctionnalité similaire Lancement de GPT-OSS par OpenAI https://openai.com/index/introducing-gpt-oss/ https://openai.com/index/gpt-oss-model-card/ OpenAI a lancé GPT-OSS, sa première famille de modèles open-weight depuis GPT–2. Deux modèles sont disponibles : gpt-oss–120b et gpt-oss–20b, qui sont des modèles mixtes d'experts conçus pour le raisonnement et les tâches d'agent. Les modèles sont distribués sous licence Apache 2.0, permettant leur utilisation et leur personnalisation gratuites, y compris pour des applications commerciales. Le modèle gpt-oss–120b est capable de performances proches du modèle OpenAI o4-mini, tandis que le gpt-oss–20b est comparable au o3-mini. OpenAI a également open-sourcé un outil de rendu appelé Harmony en Python et Rust pour en faciliter l'adoption. Les modèles sont optimisés pour fonctionner localement et sont pris en charge par des plateformes comme Hugging Face et Ollama. OpenAI a mené des recherches sur la sécurité pour s'assurer que les modèles ne pouvaient pas être affinés pour des utilisations malveillantes dans les domaines biologique, chimique ou cybernétique. Anthropic lance Opus 4.1 https://www.anthropic.com/news/claude-opus–4–1 Anthropic a publié Claude Opus 4.1, une mise à jour de son modèle de langage. Cette nouvelle version met l'accent sur l'amélioration des performances en codage, en raisonnement et sur les tâches de recherche et d'analyse de données. Le modèle a obtenu un score de 74,5 % sur le benchmark SWE-bench Verified, ce qui représente une amélioration par rapport à la version précédente. Il excelle notamment dans la refactorisation de code multifichier et est capable d'effectuer des recherches approfondies. Claude Opus 4.1 est disponible pour les utilisateurs payants de Claude, ainsi que via l'API, Amazon Bedrock et Vertex AI de Google Cloud, avec des tarifs identiques à ceux d'Opus 4. Il est présenté comme un remplacement direct de Claude Opus 4, avec des performances et une précision supérieures pour les tâches de programmation réelles. OpenAI Summer Update. GPT–5 is out https://openai.com/index/introducing-gpt–5/ Détails https://openai.com/index/gpt–5-new-era-of-work/ https://openai.com/index/introducing-gpt–5-for-developers/ https://openai.com/index/gpt–5-safe-completions/ https://openai.com/index/gpt–5-system-card/ Amélioration majeure des capacités cognitives - GPT‑5 montre un niveau de raisonnement, d'abstraction et de compréhension nettement supérieur aux modèles précédents. Deux variantes principales - gpt-5-main : rapide, efficace pour les tâches générales. gpt-5-thinking : plus lent mais spécialisé dans les tâches complexes, nécessitant réflexion profonde. Routeur intelligent intégré - Le système sélectionne automatiquement la version la plus adaptée à la tâche (rapide ou réfléchie), sans intervention de l'utilisateur. Fenêtre de contexte encore étendue - GPT‑5 peut traiter des volumes de texte plus longs (jusqu'à 1 million de tokens dans certaines versions), utile pour des documents ou projets entiers. Réduction significative des hallucinations - GPT‑5 donne des réponses plus fiables, avec moins d'erreurs inventées ou de fausses affirmations. Comportement plus neutre et moins sycophant - Il a été entraîné pour mieux résister à l'alignement excessif avec les opinions de l'utilisateur. Capacité accrue à suivre des instructions complexes - GPT‑5 comprend mieux les consignes longues, implicites ou nuancées. Approche “Safe completions” - Remplacement des “refus d'exécution” par des réponses utiles mais sûres — le modèle essaie de répondre avec prudence plutôt que bloquer. Prêt pour un usage professionnel à grande échelle - Optimisé pour le travail en entreprise : rédaction, programmation, synthèse, automatisation, gestion de tâches, etc. Améliorations spécifiques pour le codage - GPT‑5 est plus performant pour l'écriture de code, la compréhension de contextes logiciels complexes, et l'usage d'outils de développement. Expérience utilisateur plus rapide et fluide- Le système réagit plus vite grâce à une orchestration optimisée entre les différents sous-modèles. Capacités agentiques renforcées - GPT‑5 peut être utilisé comme base pour des agents autonomes capables d'accomplir des objectifs avec peu d'interventions humaines. Multimodalité maîtrisée (texte, image, audio) - GPT‑5 intègre de façon plus fluide la compréhension de formats multiples, dans un seul modèle. Fonctionnalités pensées pour les développeurs - Documentation plus claire, API unifiée, modèles plus transparents et personnalisables. Personnalisation contextuelle accrue - Le système s'adapte mieux au style, ton ou préférences de l'utilisateur, sans instructions répétées. Utilisation énergétique et matérielle optimisée - Grâce au routeur interne, les ressources sont utilisées plus efficacement selon la complexité des tâches. Intégration sécurisée dans les produits ChatGPT - Déjà déployé dans ChatGPT avec des bénéfices immédiats pour les utilisateurs Pro et entreprises. Modèle unifié pour tous les usages - Un seul système capable de passer de la conversation légère à des analyses scientifiques ou du code complexe. Priorité à la sécurité et à l'alignement - GPT‑5 a été conçu dès le départ pour minimiser les abus, biais ou comportements indésirables. Pas encore une AGI - OpenAI insiste : malgré ses capacités impressionnantes, GPT‑5 n'est pas une intelligence artificielle générale. Non, non, les juniors ne sont pas obsolètes malgré l'IA ! (dixit GitHub) https://github.blog/ai-and-ml/generative-ai/junior-developers-arent-obsolete-heres-how-to-thrive-in-the-age-of-ai/ L'IA transforme le développement logiciel, mais les développeurs juniors ne sont pas obsolètes. Les nouveaux apprenants sont bien positionnés, car déjà familiers avec les outils IA. L'objectif est de développer des compétences pour travailler avec l'IA, pas d'être remplacé. La créativité et la curiosité sont des qualités humaines clés. Cinq façons de se démarquer : Utiliser l'IA (ex: GitHub Copilot) pour apprendre plus vite, pas seulement coder plus vite (ex: mode tuteur, désactiver l'autocomplétion temporairement). Construire des projets publics démontrant ses compétences (y compris en IA). Maîtriser les workflows GitHub essentiels (GitHub Actions, contribution open source, pull requests). Affûter son expertise en révisant du code (poser des questions, chercher des patterns, prendre des notes). Déboguer plus intelligemment et rapidement avec l'IA (ex: Copilot Chat pour explications, corrections, tests). Ecrire son premier agent IA avec A2A avec WildFly par Emmanuel Hugonnet https://www.wildfly.org/news/2025/08/07/Building-your-First-A2A-Agent/ Protocole Agent2Agent (A2A) : Standard ouvert pour l'interopérabilité universelle des agents IA. Permet communication et collaboration efficaces entre agents de différents fournisseurs/frameworks. Crée des écosystèmes multi-agents unifiés, automatisant les workflows complexes. Objet de l'article : Guide pour construire un premier agent A2A (agent météo) dans WildFly. Utilise A2A Java SDK pour Jakarta Servers, WildFly AI Feature Pack, un LLM (Gemini) et un outil Python (MCP). Agent conforme A2A v0.2.5. Prérequis : JDK 17+, Apache Maven 3.8+, IDE Java, Google AI Studio API Key, Python 3.10+, uv. Étapes de construction de l'agent météo : Création du service LLM : Interface Java (WeatherAgent) utilisant LangChain4J pour interagir avec un LLM et un outil Python MCP (fonctions get_alerts, get_forecast). Définition de l'agent A2A (via CDI) : ▪︎ Agent Card : Fournit les métadonnées de l'agent (nom, description, URL, capacités, compétences comme “weather_search”). Agent Executor : Gère les requêtes A2A entrantes, extrait le message utilisateur, appelle le service LLM et formate la réponse. Exposition de l'agent : Enregistrement d'une application JAX-RS pour les endpoints. Déploiement et test : Configuration de l'outil A2A-inspector de Google (via un conteneur Podman). Construction du projet Maven, configuration des variables d'environnement (ex: GEMINI_API_KEY). Lancement du serveur WildFly. Conclusion : Transformation minimale d'une application IA en agent A2A. Permet la collaboration et le partage d'informations entre agents IA, indépendamment de leur infrastructure sous-jacente. Outillage IntelliJ IDEa bouge vers une distribution unifiée https://blog.jetbrains.com/idea/2025/07/intellij-idea-unified-distribution-plan/ À partir de la version 2025.3, IntelliJ IDEA Community Edition ne sera plus distribuée séparément. Une seule version unifiée d'IntelliJ IDEA regroupera les fonctionnalités des éditions Community et Ultimate. Les fonctionnalités avancées de l'édition Ultimate seront accessibles via abonnement. Les utilisateurs sans abonnement auront accès à une version gratuite enrichie par rapport à l'édition Community actuelle. Cette unification vise à simplifier l'expérience utilisateur et réduire les différences entre les éditions. Les utilisateurs Community seront automatiquement migrés vers cette nouvelle version unifiée. Il sera possible d'activer les fonctionnalités Ultimate temporairement d'un simple clic. En cas d'expiration d'abonnement Ultimate, l'utilisateur pourra continuer à utiliser la version installée avec un jeu limité de fonctionnalités gratuites, sans interruption. Ce changement reflète l'engagement de JetBrains envers l'open source et l'adaptation aux besoins de la communauté. Prise en charge des Ancres YAML dans GitHub Actions https://github.com/actions/runner/issues/1182#issuecomment–3150797791 Afin d'éviter de dupliquer du contenu dans un workflow les Ancres permettent d'insérer des morceaux réutilisables de YAML Fonctionnalité attendue depuis des années et disponible chez GitLab depuis bien longtemps. Elle a été déployée le 4 aout. Attention à ne pas en abuser car la lisibilité de tels documents n'est pas si facile Gemini CLI rajoute les custom commands comme Claude https://cloud.google.com/blog/topics/developers-practitioners/gemini-cli-custom-slash-commands Mais elles sont au format TOML, on ne peut donc pas les partager avec Claude :disappointed: Automatiser ses workflows IA avec les hooks de Claude Code https://blog.gitbutler.com/automate-your-ai-workflows-with-claude-code-hooks/ Claude Code propose des hooks qui permettent d'exécuter des scripts à différents moments d'une session, par exemple au début, lors de l'utilisation d'outils, ou à la fin. Ces hooks facilitent l'automatisation de tâches comme la gestion de branches Git, l'envoi de notifications, ou l'intégration avec d'autres outils. Un exemple simple est l'envoi d'une notification sur le bureau à la fin d'une session. Les hooks se configurent via trois fichiers JSON distincts selon le scope : utilisateur, projet ou local. Sur macOS, l'envoi de notifications nécessite une permission spécifique via l'application “Script Editor”. Il est important d'avoir une version à jour de Claude Code pour utiliser ces hooks. GitButler permet desormais de s'intégrer à Claude Code via ces hooks: https://blog.gitbutler.com/parallel-claude-code/ Le client Git de Jetbrains bientot en standalone https://lp.jetbrains.com/closed-preview-for-jetbrains-git-client/ Demandé par certains utilisateurs depuis longtemps Ca serait un client graphique du même style qu'un GitButler, SourceTree, etc Apache Maven 4 …. arrive …. l'utilitaire mvnupva vous aider à upgrader https://maven.apache.org/tools/mvnup.html Fixe les incompatibilités connues Nettoie les redondances et valeurs par defaut (versions par ex) non utiles pour Maven 4 Reformattage selon les conventions maven … Une GitHub Action pour Gemini CLI https://blog.google/technology/developers/introducing-gemini-cli-github-actions/ Google a lancé Gemini CLI GitHub Actions, un agent d'IA qui fonctionne comme un “coéquipier de code” pour les dépôts GitHub. L'outil est gratuit et est conçu pour automatiser des tâches de routine telles que le triage des problèmes (issues), l'examen des demandes de tirage (pull requests) et d'autres tâches de développement. Il agit à la fois comme un agent autonome et un collaborateur que les développeurs peuvent solliciter à la demande, notamment en le mentionnant dans une issue ou une pull request. L'outil est basé sur la CLI Gemini, un agent d'IA open-source qui amène le modèle Gemini directement dans le terminal. Il utilise l'infrastructure GitHub Actions, ce qui permet d'isoler les processus dans des conteneurs séparés pour des raisons de sécurité. Trois flux de travail (workflows) open-source sont disponibles au lancement : le triage intelligent des issues, l'examen des pull requests et la collaboration à la demande. Pas besoin de MCP, le code est tout ce dont vous avez besoin https://lucumr.pocoo.org/2025/7/3/tools/ Armin souligne qu'il n'est pas fan du protocole MCP (Model Context Protocol) dans sa forme actuelle : il manque de composabilité et exige trop de contexte. Il remarque que pour une même tâche (ex. GitHub), utiliser le CLI est souvent plus rapide et plus efficace en termes de contexte que passer par un serveur MCP. Selon lui, le code reste la solution la plus simple et fiable, surtout pour automatiser des tâches répétitives. Il préfère créer des scripts clairs plutôt que se reposer sur l'inférence LLM : cela facilite la vérification, la maintenance et évite les erreurs subtiles. Pour les tâches récurrentes, si on les automatise, mieux vaut le faire avec du code reusable, plutôt que de laisser l'IA deviner à chaque fois. Il illustre cela en convertissant son blog entier de reStructuredText à Markdown : plutôt qu'un usage direct d'IA, il a demandé à Claude de générer un script complet, avec parsing AST, comparaison des fichiers, validation et itération. Ce workflow LLM→code→LLM (analyse et validation) lui a donné confiance dans le résultat final, tout en conservant un contrôle humain sur le processus. Il juge que MCP ne permet pas ce type de pipeline automatisé fiable, car il introduit trop d'inférence et trop de variations par appel. Pour lui, coder reste le meilleur moyen de garder le contrôle, la reproductibilité et la clarté dans les workflows automatisés. MCP vs CLI … https://www.async-let.com/blog/my-take-on-the-mcp-verses-cli-debate/ Cameron raconte son expérience de création du serveur XcodeBuildMCP, qui lui a permis de mieux comprendre le débat entre servir l'IA via MCP ou laisser l'IA utiliser directement les CLI du système. Selon lui, les CLIs restent préférables pour les développeurs experts recherchant contrôle, transparence, performance et simplicité. Mais les serveurs MCP excellent sur les workflows complexes, les contextes persistants, les contraintes de sécurité, et facilitent l'accès pour les utilisateurs moins expérimentés. Il reconnaît la critique selon laquelle MCP consomme trop de contexte (« context bloat ») et que les appels CLI peuvent être plus rapides et compréhensibles. Toutefois, il souligne que beaucoup de problèmes proviennent de la qualité des implémentations clients, pas du protocole MCP en lui‑même. Pour lui, un bon serveur MCP peut proposer des outils soigneusement définis qui simplifient la vie de l'IA (par exemple, renvoyer des données structurées plutôt que du texte brut à parser). Il apprécie la capacité des MCP à offrir des opérations état‑durables (sessions, mémoire, logs capturés), ce que les CLI ne gèrent pas naturellement. Certains scénarios ne peuvent pas fonctionner via CLI (pas de shell accessible) alors que MCP, en tant que protocole indépendant, reste utilisable par n'importe quel client. Son verdict : pas de solution universelle — chaque contexte mérite d'être évalué, et on ne devrait pas imposer MCP ou CLI à tout prix. Jules, l'agent de code asynchrone gratuit de Google, est sorti de beta et est disponible pour tout le monde https://blog.google/technology/google-labs/jules-now-available/ Jules, agent de codage asynchrone, est maintenant publiquement disponible. Propulsé par Gemini 2.5 Pro. Phase bêta : 140 000+ améliorations de code et retours de milliers de développeurs. Améliorations : interface utilisateur, corrections de bugs, réutilisation des configurations, intégration GitHub Issues, support multimodal. Gemini 2.5 Pro améliore les plans de codage et la qualité du code. Nouveaux paliers structurés : Introductif, Google AI Pro (limites 5x supérieures), Google AI Ultra (limites 20x supérieures). Déploiement immédiat pour les abonnés Google AI Pro et Ultra, incluant les étudiants éligibles (un an gratuit de AI Pro). Architecture Valoriser la réduction de la dette technique : un vrai défi https://www.lemondeinformatique.fr/actualites/lire-valoriser-la-reduction-de-la-dette-technique-mission-impossible–97483.html La dette technique est un concept mal compris et difficile à valoriser financièrement auprès des directions générales. Les DSI ont du mal à mesurer précisément cette dette, à allouer des budgets spécifiques, et à prouver un retour sur investissement clair. Cette difficulté limite la priorisation des projets de réduction de dette technique face à d'autres initiatives jugées plus urgentes ou stratégiques. Certaines entreprises intègrent progressivement la gestion de la dette technique dans leurs processus de développement. Des approches comme le Software Crafting visent à améliorer la qualité du code pour limiter l'accumulation de cette dette. L'absence d'outils adaptés pour mesurer les progrès rend la démarche encore plus complexe. En résumé, réduire la dette technique reste une mission délicate qui nécessite innovation, méthode et sensibilisation en interne. Il ne faut pas se Mocker … https://martinelli.ch/why-i-dont-use-mocking-frameworks-and-why-you-might-not-need-them-either/ https://blog.tremblay.pro/2025/08/not-using-mocking-frmk.html L'auteur préfère utiliser des fakes ou stubs faits à la main plutôt que des frameworks de mocking comme Mockito ou EasyMock. Les frameworks de mocking isolent le code, mais entraînent souvent : Un fort couplage entre les tests et les détails d'implémentation. Des tests qui valident le mock plutôt que le comportement réel. Deux principes fondamentaux guident son approche : Favoriser un design fonctionnel, avec logique métier pure (fonctions sans effets de bord). Contrôler les données de test : par exemple en utilisant des bases réelles (via Testcontainers) plutôt que de simuler. Dans sa pratique, les seuls cas où un mock externe est utilisé concernent les services HTTP externes, et encore il préfère en simuler seulement le transport plutôt que le comportement métier. Résultat : les tests deviennent plus simples, plus rapides à écrire, plus fiables, et moins fragiles aux évolutions du code. L'article conclut que si tu conçois correctement ton code, tu pourrais très bien ne pas avoir besoin de frameworks de mocking du tout. Le blog en réponse d'Henri Tremblay nuance un peu ces retours Méthodologies C'est quoi être un bon PM ? (Product Manager) Article de Chris Perry, un PM chez Google : https://thechrisperry.substack.com/p/being-a-good-pm-at-google Le rôle de PM est difficile : Un travail exigeant, où il faut être le plus impliqué de l'équipe pour assurer le succès. 1. Livrer (shipper) est tout ce qui compte : La priorité absolue. Mieux vaut livrer et itérer rapidement que de chercher la perfection en théorie. Un produit livré permet d'apprendre de la réalité. 2. Donner l'envie du grand large : La meilleure façon de faire avancer un projet est d'inspirer l'équipe avec une vision forte et désirable. Montrer le “pourquoi”. 3. Utiliser son produit tous les jours : Non négociable pour réussir. Permet de développer une intuition et de repérer les vrais problèmes que la recherche utilisateur ne montre pas toujours. 4. Être un bon ami : Créer des relations authentiques et aider les autres est un facteur clé de succès à long terme. La confiance est la base d'une exécution rapide. 5. Donner plus qu'on ne reçoit : Toujours chercher à aider et à collaborer. La stratégie optimale sur la durée est la coopération. Ne pas être possessif avec ses idées. 6. Utiliser le bon levier : Pour obtenir une décision, il faut identifier la bonne personne qui a le pouvoir de dire “oui”, et ne pas se laisser bloquer par des avis non décisionnaires. 7. N'aller que là où on apporte de la valeur : Combler les manques, faire le travail ingrat que personne ne veut faire. Savoir aussi s'écarter (réunions, projets) quand on n'est pas utile. 8. Le succès a plusieurs parents, l'échec est orphelin : Si le produit réussit, c'est un succès d'équipe. S'il échoue, c'est la faute du PM. Il faut assumer la responsabilité finale. Conclusion : Le PM est un chef d'orchestre. Il ne peut pas jouer de tous les instruments, mais son rôle est d'orchestrer avec humilité le travail de tous pour créer quelque chose d'harmonieux. Tester des applications Spring Boot prêtes pour la production : points clés https://www.wimdeblauwe.com/blog/2025/07/30/how-i-test-production-ready-spring-boot-applications/ L'auteur (Wim Deblauwe) détaille comment il structure ses tests dans une application Spring Boot destinée à la production. Le projet inclut automatiquement la dépendance spring-boot-starter-test, qui regroupe JUnit 5, AssertJ, Mockito, Awaitility, JsonAssert, XmlUnit et les outils de testing Spring. Tests unitaires : ciblent les fonctions pures (record, utilitaire), testés simplement avec JUnit et AssertJ sans démarrage du contexte Spring. Tests de cas d'usage (use case) : orchestrent la logique métier, généralement via des use cases qui utilisent un ou plusieurs dépôts de données. Tests JPA/repository : vérifient les interactions avec la base via des tests realisant des opérations CRUD (avec un contexte Spring pour la couche persistance). Tests de contrôleur : permettent de tester les endpoints web (ex. @WebMvcTest), souvent avec MockBean pour simuler les dépendances. Tests d'intégration complets : ils démarrent tout le contexte Spring (@SpringBootTest) pour tester l'application dans son ensemble. L'auteur évoque également des tests d'architecture, mais sans entrer dans le détail dans cet article. Résultat : une pyramide de tests allant des plus rapides (unitaires) aux plus complets (intégration), garantissant fiabilité, vitesse et couverture sans surcharge inutile. Sécurité Bitwarden offre un serveur MCP pour que les agents puissent accéder aux mots de passe https://nerds.xyz/2025/07/bitwarden-mcp-server-secure-ai/ Bitwarden introduit un serveur MCP (Model Context Protocol) destiné à intégrer de manière sécurisée les agents IA dans les workflows de gestion de mots de passe. Ce serveur fonctionne en architecture locale (local-first) : toutes les interactions et les données sensibles restent sur la machine de l'utilisateur, garantissant l'application du principe de chiffrement zero‑knowledge. L'intégration se fait via l'interface CLI de Bitwarden, permettant aux agents IA de générer, récupérer, modifier et verrouiller les identifiants via des commandes sécurisées. Le serveur peut être auto‑hébergé pour un contrôle maximal des données. Le protocole MCP est un standard ouvert qui permet de connecter de façon uniforme des agents IA à des sources de données et outils tiers, simplifiant les intégrations entre LLM et applications. Une démo avec Claude (agent IA d'Anthropic) montre que l'IA peut interagir avec le coffre Bitwarden : vérifier l'état, déverrouiller le vault, générer ou modifier des identifiants, le tout sans intervention humaine directe. Bitwarden affiche une approche priorisant la sécurité, mais reconnaît les risques liés à l'utilisation d'IA autonome. L'usage d'un LLM local privé est fortement recommandé pour limiter les vulnérabilités. Si tu veux, je peux aussi te résumer les enjeux principaux (interopérabilité, sécurité, cas d'usage) ou un extrait spécifique ! NVIDIA a une faille de securite critique https://www.wiz.io/blog/nvidia-ai-vulnerability-cve–2025–23266-nvidiascape Il s'agit d'une faille d'évasion de conteneur dans le NVIDIA Container Toolkit. La gravité est jugée critique avec un score CVSS de 9.0. Cette vulnérabilité permet à un conteneur malveillant d'obtenir un accès root complet sur l'hôte. L'origine du problème vient d'une mauvaise configuration des hooks OCI dans le toolkit. L'exploitation peut se faire très facilement, par exemple avec un Dockerfile de seulement trois lignes. Le risque principal concerne la compromission de l'isolation entre différents clients sur des infrastructures cloud GPU partagées. Les versions affectées incluent toutes les versions du NVIDIA Container Toolkit jusqu'à la 1.17.7 et du NVIDIA GPU Operator jusqu'à la version 25.3.1. Pour atténuer le risque, il est recommandé de mettre à jour vers les dernières versions corrigées. En attendant, il est possible de désactiver certains hooks problématiques dans la configuration pour limiter l'exposition. Cette faille met en lumière l'importance de renforcer la sécurité des environnements GPU partagés et la gestion des conteneurs AI. Fuite de données de l'application Tea : points essentiels https://knowyourmeme.com/memes/events/the-tea-app-data-leak Tea est une application lancée en 2023 qui permet aux femmes de laisser des avis anonymes sur des hommes rencontrés. En juillet 2025, une importante fuite a exposé environ 72 000 images sensibles (selfies, pièces d'identité) et plus d'1,1 million de messages privés. La fuite a été révélée après qu'un utilisateur ait partagé un lien pour télécharger la base de données compromise. Les données touchées concernaient majoritairement des utilisateurs inscrits avant février 2024, date à laquelle l'application a migré vers une infrastructure plus sécurisée. En réponse, Tea prévoit de proposer des services de protection d'identité aux utilisateurs impactés. Faille dans le paquet npm is : attaque en chaîne d'approvisionnement https://socket.dev/blog/npm-is-package-hijacked-in-expanding-supply-chain-attack Une campagne de phishing ciblant les mainteneurs npm a compromis plusieurs comptes, incluant celui du paquet is. Des versions compromises du paquet is (notamment les versions 3.3.1 et 5.0.0) contenaient un chargeur de malware JavaScript destiné aux systèmes Windows. Ce malware a offert aux attaquants un accès à distance via WebSocket, permettant potentiellement l'exécution de code arbitraire. L'attaque fait suite à d'autres compromissions de paquets populaires comme eslint-config-prettier, eslint-plugin-prettier, synckit, @pkgr/core, napi-postinstall, et got-fetch. Tous ces paquets ont été publiés sans aucun commit ou PR sur leurs dépôts GitHub respectifs, signalant un accès non autorisé aux tokens mainteneurs. Le domaine usurpé [npnjs.com](http://npnjs.com) a été utilisé pour collecter les jetons d'accès via des emails de phishing trompeurs. L'épisode met en lumière la fragilité des chaînes d'approvisionnement logicielle dans l'écosystème npm et la nécessité d'adopter des pratiques renforcées de sécurité autour des dépendances. Revues de sécurité automatisées avec Claude Code https://www.anthropic.com/news/automate-security-reviews-with-claude-code Anthropic a lancé des fonctionnalités de sécurité automatisées pour Claude Code, un assistant de codage d'IA en ligne de commande. Ces fonctionnalités ont été introduites en réponse au besoin croissant de maintenir la sécurité du code alors que les outils d'IA accélèrent considérablement le développement de logiciels. Commande /security-review : les développeurs peuvent exécuter cette commande dans leur terminal pour demander à Claude d'identifier les vulnérabilités de sécurité, notamment les risques d'injection SQL, les vulnérabilités de script intersite (XSS), les failles d'authentification et d'autorisation, ainsi que la gestion non sécurisée des données. Claude peut également suggérer et implémenter des correctifs. Intégration GitHub Actions : une nouvelle action GitHub permet à Claude Code d'analyser automatiquement chaque nouvelle demande d'extraction (pull request). L'outil examine les modifications de code pour y trouver des vulnérabilités, applique des règles personnalisables pour filtrer les faux positifs et commente directement la demande d'extraction avec les problèmes détectés et les correctifs recommandés. Ces fonctionnalités sont conçues pour créer un processus d'examen de sécurité cohérent et s'intégrer aux pipelines CI/CD existants, ce qui permet de s'assurer qu'aucun code n'atteint la production sans un examen de sécurité de base. Loi, société et organisation Google embauche les personnes clés de Windsurf https://www.blog-nouvelles-technologies.fr/333959/openai-windsurf-google-deepmind-codage-agentique/ windsurf devait être racheté par OpenAI Google ne fait pas d'offre de rachat mais débauche quelques personnes clés de Windsurf Windsurf reste donc indépendante mais sans certains cerveaux y compris son PDG. Les nouveaux dirigeants sont les ex leaders des force de vente Donc plus une boîte tech Pourquoi le deal a 3 milliard est tombé à l'eau ? On ne sait pas mais la divergence et l‘indépendance technologique est possiblement en cause. Les transfuge vont bosser chez Deepmind dans le code argentique Opinion Article: https://www.linkedin.com/pulse/dear-people-who-think-ai-low-skilled-code-monkeys-future-jan-moser-svade/ Jan Moser critique ceux qui pensent que l'IA et les développeurs peu qualifiés peuvent remplacer les ingénieurs logiciels compétents. Il cite l'exemple de l'application Tea, une plateforme de sécurité pour femmes, qui a exposé 72 000 images d'utilisateurs en raison d'une mauvaise configuration de Firebase et d'un manque de pratiques de développement sécurisées. Il souligne que l'absence de contrôles automatisés et de bonnes pratiques de sécurité a permis cette fuite de données. Moser avertit que des outils comme l'IA ne peuvent pas compenser l'absence de compétences en génie logiciel, notamment en matière de sécurité, de gestion des erreurs et de qualité du code. Il appelle à une reconnaissance de la valeur des ingénieurs logiciels qualifiés et à une approche plus rigoureuse dans le développement logiciel. YouTube déploie une technologie d'estimation d'âge pour identifier les adolescents aux États-Unis https://techcrunch.com/2025/07/29/youtube-rolls-out-age-estimatation-tech-to-identify-u-s-teens-and-apply-additional-protections/ Sujet très à la mode, surtout au UK mais pas que… YouTube commence à déployer une technologie d'estimation d'âge basée sur l'IA pour identifier les utilisateurs adolescents aux États-Unis, indépendamment de l'âge déclaré lors de l'inscription. Cette technologie analyse divers signaux comportementaux, tels que l'historique de visionnage, les catégories de vidéos consultées et l'âge du compte. Lorsqu'un utilisateur est identifié comme adolescent, YouTube applique des protections supplémentaires, notamment : Désactivation des publicités personnalisées. Activation des outils de bien-être numérique, tels que les rappels de temps d'écran et de coucher. Limitation de la visualisation répétée de contenus sensibles, comme ceux liés à l'image corporelle. Si un utilisateur est incorrectement identifié comme mineur, il peut vérifier son âge via une pièce d'identité gouvernementale, une carte de crédit ou un selfie. Ce déploiement initial concerne un petit groupe d'utilisateurs aux États-Unis et sera étendu progressivement. Cette initiative s'inscrit dans les efforts de YouTube pour renforcer la sécurité des jeunes utilisateurs en ligne. Mistral AI : contribution à un standard environnemental pour l'IA https://mistral.ai/news/our-contribution-to-a-global-environmental-standard-for-ai Mistral AI a réalisé la première analyse de cycle de vie complète d'un modèle d'IA, en collaboration avec plusieurs partenaires. L'étude quantifie l'impact environnemental du modèle Mistral Large 2 sur les émissions de gaz à effet de serre, la consommation d'eau, et l'épuisement des ressources. La phase d'entraînement a généré 20,4 kilotonnes de CO₂ équivalent, consommé 281 000 m³ d'eau, et utilisé 660 kg SB-eq (mineral consumption). Pour une réponse de 400 tokens, l'impact marginal est faible mais non négligeable : 1,14 gramme de CO₂, 45 mL d'eau, et 0,16 mg d'équivalent antimoine. Mistral propose trois indicateurs pour évaluer cet impact : l'impact absolu de l'entraînement, l'impact marginal de l'inférence, et le ratio inference/impact total sur le cycle de vie. L'entreprise souligne l'importance de choisir le modèle en fonction du cas d'usage pour limiter l'empreinte environnementale. Mistral appelle à plus de transparence et à l'adoption de standards internationaux pour permettre une comparaison claire entre modèles. L'IA promettait plus d'efficacité… elle nous fait surtout travailler plus https://afterburnout.co/p/ai-promised-to-make-us-more-efficient Les outils d'IA devaient automatiser les tâches pénibles et libérer du temps pour les activités stratégiques et créatives. En réalité, le temps gagné est souvent aussitôt réinvesti dans d'autres tâches, créant une surcharge. Les utilisateurs croient être plus productifs avec l'IA, mais les données contredisent cette impression : une étude montre que les développeurs utilisant l'IA prennent 19 % de temps en plus pour accomplir leurs tâches. Le rapport DORA 2024 observe une baisse de performance globale des équipes lorsque l'usage de l'IA augmente : –1,5 % de throughput et –7,2 % de stabilité de livraison pour +25 % d'adoption de l'IA. L'IA ne réduit pas la charge mentale, elle la déplace : rédaction de prompts, vérification de résultats douteux, ajustements constants… Cela épuise et limite le temps de concentration réelle. Cette surcharge cognitive entraîne une forme de dette mentale : on ne gagne pas vraiment du temps, on le paie autrement. Le vrai problème vient de notre culture de la productivité, qui pousse à toujours vouloir optimiser, quitte à alimenter l'épuisement professionnel. Trois pistes concrètes : Repenser la productivité non en temps gagné, mais en énergie préservée. Être sélectif dans l'usage des outils IA, en fonction de son ressenti et non du battage médiatique. Accepter la courbe en J : l'IA peut être utile, mais nécessite des ajustements profonds pour produire des gains réels. Le vrai hack de productivité ? Parfois, ralentir pour rester lucide et durable. Conférences MCP Submit Europe https://mcpdevsummit.ai/ Retour de JavaOne en 2026 https://inside.java/2025/08/04/javaone-returns–2026/ JavaOne, la conférence dédiée à la communauté Java, fait son grand retour dans la Bay Area du 17 au 19 mars 2026. Après le succès de l'édition 2025, ce retour s'inscrit dans la continuité de la mission initiale de la conférence : rassembler la communauté pour apprendre, collaborer et innover. La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs : 25–27 août 2025 : SHAKA Biarritz - Biarritz (France) 5 septembre 2025 : JUG Summer Camp 2025 - La Rochelle (France) 12 septembre 2025 : Agile Pays Basque 2025 - Bidart (France) 15 septembre 2025 : Agile Tour Montpellier - Montpellier (France) 18–19 septembre 2025 : API Platform Conference - Lille (France) & Online 22–24 septembre 2025 : Kernel Recipes - Paris (France) 22–27 septembre 2025 : La Mélée Numérique - Toulouse (France) 23 septembre 2025 : OWASP AppSec France 2025 - Paris (France) 23–24 septembre 2025 : AI Engineer Paris - Paris (France) 25 septembre 2025 : Agile Game Toulouse - Toulouse (France) 25–26 septembre 2025 : Paris Web 2025 - Paris (France) 30 septembre 2025–1 octobre 2025 : PyData Paris 2025 - Paris (France) 2 octobre 2025 : Nantes Craft - Nantes (France) 2–3 octobre 2025 : Volcamp - Clermont-Ferrand (France) 3 octobre 2025 : DevFest Perros-Guirec 2025 - Perros-Guirec (France) 6–7 octobre 2025 : Swift Connection 2025 - Paris (France) 6–10 octobre 2025 : Devoxx Belgium - Antwerp (Belgium) 7 octobre 2025 : BSides Mulhouse - Mulhouse (France) 7–8 octobre 2025 : Agile en Seine - Issy-les-Moulineaux (France) 8–10 octobre 2025 : SIG 2025 - Paris (France) & Online 9 octobre 2025 : DevCon #25 : informatique quantique - Paris (France) 9–10 octobre 2025 : Forum PHP 2025 - Marne-la-Vallée (France) 9–10 octobre 2025 : EuroRust 2025 - Paris (France) 16 octobre 2025 : PlatformCon25 Live Day Paris - Paris (France) 16 octobre 2025 : Power 365 - 2025 - Lille (France) 16–17 octobre 2025 : DevFest Nantes - Nantes (France) 17 octobre 2025 : Sylius Con 2025 - Lyon (France) 17 octobre 2025 : ScalaIO 2025 - Paris (France) 17–19 octobre 2025 : OpenInfra Summit Europe - Paris (France) 20 octobre 2025 : Codeurs en Seine - Rouen (France) 23 octobre 2025 : Cloud Nord - Lille (France) 30–31 octobre 2025 : Agile Tour Bordeaux 2025 - Bordeaux (France) 30–31 octobre 2025 : Agile Tour Nantais 2025 - Nantes (France) 30 octobre 2025–2 novembre 2025 : PyConFR 2025 - Lyon (France) 4–7 novembre 2025 : NewCrafts 2025 - Paris (France) 5–6 novembre 2025 : Tech Show Paris - Paris (France) 6 novembre 2025 : dotAI 2025 - Paris (France) 6 novembre 2025 : Agile Tour Aix-Marseille 2025 - Gardanne (France) 7 novembre 2025 : BDX I/O - Bordeaux (France) 12–14 novembre 2025 : Devoxx Morocco - Marrakech (Morocco) 13 novembre 2025 : DevFest Toulouse - Toulouse (France) 15–16 novembre 2025 : Capitole du Libre - Toulouse (France) 19 novembre 2025 : SREday Paris 2025 Q4 - Paris (France) 19–21 novembre 2025 : Agile Grenoble - Grenoble (France) 20 novembre 2025 : OVHcloud Summit - Paris (France) 21 novembre 2025 : DevFest Paris 2025 - Paris (France) 27 novembre 2025 : DevFest Strasbourg 2025 - Strasbourg (France) 28 novembre 2025 : DevFest Lyon - Lyon (France) 1–2 décembre 2025 : Tech Rocks Summit 2025 - Paris (France) 4–5 décembre 2025 : Agile Tour Rennes - Rennes (France) 5 décembre 2025 : DevFest Dijon 2025 - Dijon (France) 9–11 décembre 2025 : APIdays Paris - Paris (France) 9–11 décembre 2025 : Green IO Paris - Paris (France) 10–11 décembre 2025 : Devops REX - Paris (France) 10–11 décembre 2025 : Open Source Experience - Paris (France) 11 décembre 2025 : Normandie.ai 2025 - Rouen (France) 28–31 janvier 2026 : SnowCamp 2026 - Grenoble (France) 2–6 février 2026 : Web Days Convention - Aix-en-Provence (France) 3 février 2026 : Cloud Native Days France 2026 - Paris (France) 12–13 février 2026 : Touraine Tech #26 - Tours (France) 22–24 avril 2026 : Devoxx France 2026 - Paris (France) 23–25 avril 2026 : Devoxx Greece - Athens (Greece) 17 juin 2026 : Devoxx Poland - Krakow (Poland) Nous contacter Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs Contactez-nous via X/twitter https://twitter.com/lescastcodeurs ou Bluesky https://bsky.app/profile/lescastcodeurs.com Faire un crowdcast ou une crowdquestion Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/

time community ai power google uk internet guide pr france building spring data elon musk microsoft chatgpt attention mvp phase dans agent construction tests windows bay area patterns ces tea tout ia pas limitations gemini openai faire distribution extension nvidia runner blue sky passage rust api retour conf agile gpt python cela toujours sb nouveau unis ml linux priorit trois java github guillaume activation mieux int libert aur jest savoir num selon valid donner armin bom lam llm certains javascript anthropic documentation exposition opus apache mod donc arnaud nouvelles contr prise gpu grok changement cpu maven nouveaux parfois m1 travailler google cloud ast exp dns certaines cinq normandie aff tester vall construire counted sql verified cloudflare principales moser lorsqu node loi git utiliser pdg sujet sortie afin sig lancement deepmind fen accepter ssl gitlab axes xai spel optimisation enregistr mcp mocha mongodb toutefois ci cd mistral json modules capacit configuration cli permet paris france orta aot github copilot objet repenser comportement utilisation montrer capitole enregistrement fuite prd fixe jit appels ecrire favoriser sse oauth commande firebase crud jep oci vache bgp jetbrains swe bitwarden github actions nuage windsurf mistral ai livrer propuls faille a2a stagiaire xss remplacement websockets mocker optimis automatiser cvss chris perry devcon revues spring boot tom l personnalisation jdk lyon france vertex ai podman adk amazon bedrock jfr clis bordeaux france profilage diagramme script editor junit dockerfile javaone testcontainers provence france toulouse france strasbourg france github issues commonjs lille france micrometer codeurs sourcetree dijon france devoxx france
Angular Master Podcast
AMP 74: Devin Chasanoff on Angular 20+ (Live from Google I/O Connect Berlin!)

Angular Master Podcast

Play Episode Listen Later Aug 7, 2025 19:58


Cloud N Clear
Navigating the AI-Augmented Developer Landscape | EP 204

Cloud N Clear

Play Episode Listen Later Jul 29, 2025 22:48


What happens after AI helps you write code faster? You create a bottleneck in testing, security, and operations. In part two of their conversation, SADA's Simon Margolis and Google Cloud's Ameer Abbas tackle this exact problem. They explore how Google's AI strategy extends beyond the developer's keyboard with Gemini Code Assist and Cloud Assist, creating a balanced and efficient software lifecycle from start to finish. We address the burning questions about AI's impact on the software development ecosystem: Is AI replacing developers? What does the future hold for aspiring software engineers? Gain insights on embracing AI as an augmentation tool, the concept of "intentional prompting" versus "vibe coding," and why skilled professionals are more crucial than ever in the enterprise. This episode offers practical advice for enterprises on adopting AI tools, measuring success through quantitative and qualitative metrics, and finding internal champions to drive adoption. We also peek into the near future, discussing the evolution towards AI agents capable of multi-step inferencing and full automation for specific use cases. Key Takeaways: Gemini Code Assist: AI for developer inner-loop productivity, supporting various IDEs and SCMs. Gemini Cloud Assist: AI for cloud operations, cost optimization, and incident resolution within GCP. AI's Role in Development: Augmentation, not replacement; the importance of human agency and prompting skills. Enterprise Adoption: Strategies for integrating AI tools, measuring ROI, and fostering a culture of innovation. The Future: Agents with multi-step inferencing, automation for routine tasks, and background AI processes. Relevant Links: Blog: A framework for adopting Gemini Code Assist and measuring its impact Gemini Code Assist product page Gemini Cloud Assist product page Listen now to understand how AI is shaping the future of software delivery! Join us for more content by liking, sharing, and subscribing!

Cloud N Clear
AI in the Enterprise: Reshaping How Developers Work | EP 203

Cloud N Clear

Play Episode Listen Later Jul 15, 2025 22:46


Is generative AI just another tool in the belt, or is it a fundamental transformation of the developer profession? We kick off a two-part special to get to the bottom of how AI is impacting the enterprise. SADA's Associate CTO of AI & ML, Simon Margolis, sits down with Ameer Abbas, Senior Product Manager at Google Cloud, for an insider's look at the future of software development. They cut through the noise to discuss how tools like Gemini Code Assist are moving beyond simple code completion to augment the entire software delivery lifecycle, solving real-world challenges and changing the way we think about productivity, quality, and automation. In this episode, you'll learn: What Gemini Code Assist is and the broad range of developer personas it serves. The critical debate: Is AI augmenting developer skills or automating their jobs? How to leverage AI for practical enterprise challenges like application modernization, improving test coverage, and tackling technical debt. Why the focus is shifting from developer productivity to overall software delivery performance. Ameer's perspective on the future of development careers and why students should lean into AI, not fear it. The limitations of "vibe coding" and the need for intentional, high-quality AI prompting in a corporate environment.   Join us for more content by liking, sharing, and subscribing!

Critical Thinking - Bug Bounty Podcast
Episode 130: Minecraft Hacks to Google Hacking Star - Valentino

Critical Thinking - Bug Bounty Podcast

Play Episode Listen Later Jul 10, 2025 68:26


Episode 130: In this episode of Critical Thinking - Bug Bounty Podcast Justin is joined by Valentino, who shares his journey from hacking Minecraft to becoming a Google hunter. He talks us through several bugs, including an HTML Sanitizer bypass and .NET deserialization, and highlights the hyper creative approaches he tends to employ.Follow us on twitter at: https://x.com/ctbbpodcastGot any ideas and suggestions? Feel free to send us any feedback here: info@criticalthinkingpodcast.ioShoutout to YTCracker for the awesome intro music!====== Links ======Follow your hosts Rhynorater and Rez0 on Twitter:https://x.com/Rhynoraterhttps://x.com/rez0__====== Ways to Support CTBBPodcast ======Hop on the CTBB Discord at https://ctbb.show/discord!We also do Discord subs at $25, $10, and $5 - premium subscribers get access to private masterclasses, exploits, tools, scripts, un-redacted bug reports, etc.You can also find some hacker swag at https://ctbb.show/merch!Today's Sponsor: ThreatLocker - Patch Managementhttps://www.criticalthinkingpodcast.io/TL-patch-managementToday's Guest: Valentino - https://blog.3133700.xyz/====== Resources ======JMX ManagerStored XSS in reclamosCommand Injection in Vertex AIwhitepaper-net-deser.pdffree-after-use.goA Journey Into Finding Vulnerabilities in the PMB Library Management Systememulated-register_globals.php====== Timestamps ======(00:00:00) Introduction(00:02:38) JMXProxy Bug Story(00:09:46) Intro to Valentino(00:29:08) HTML Sanitizer bypass on MercadoLibre(00:37:16) Command injection in Vertex AI(00:44:10) .NET deserialization, & Argument injection to LFR, & Free after use(00:51:33) Luck, creativity, and evolution as Hacker(00:59:31) Issues in file extension validation components, Emulated register_globals, & AI Hacking

Rebuild
408: Democratize Coding for $200 a Month (yuka)

Rebuild

Play Episode Listen Later Jun 5, 2025 114:58


Yuka Ohishi さんをゲストに迎えて、Google I/O, Android XR, MCP, Claude Code, Vibe Coding, WWDC などについて話しました。 Show Notes TURTLE TOWER - Vietnamese Google I/O 2025 keynote in 32 minutes Google AI Studio vs. Vertex AI vs. Gemini Veo - Google DeepMind This Film Was Made Entirely With Runway AI and Google's Veo. It Nearly Broke Us. - WSJ Build | Google AI Studio Sam and Jony introduce io | OpenAI Code with Claude 2025 Rebuild: 391: Miyagawa Intelligence (yuka) Model Context Protocol simonw/llm: Access large language models from the command-line Claude Code: Deep Coding at Terminal Velocity - Anthropic Introducing GitHub Copilot agent mode (preview) For Some Recent Graduates, the A.I. Job Apocalypse May Already Be Here Why this leading AI CEO is warning the tech could cause mass unemployment | CNN Claude (referral code) Daring Fireball: The Talk Show Live From WWDC 2025: Tuesday June 10 Daring Fireball: Something Is Rotten in the State of Cupertino iOS 26, macOS 26, watchOS 26, iPadOS 26: Apple to Rebrand Device Software Sky app The Sky's the Limit

The Cloud Pod
306: Batch Better Have MySQL: Azure’s Maintenance Makeover

The Cloud Pod

Play Episode Listen Later Jun 5, 2025 94:13


Welcome to episode 306 of The Cloud Pod – where the forecast is always cloudy!  This week, we have a bunch of announcements concerning the newest offering from Anthropic – Claude Sonnet 4 and Opus 4, plus container security, Azure MySQL Maintenance, Vertex AI, and Mistral AI. Plus, we've got a Cloud Journey installment AND an aftershow – so get comfy and get ready for a trip to the clouds! Titles we almost went with this week: ECS Failures Now Have 4x the Excuses Nailing Down Your Container Security, One Patch at a Time HashiCorp’s New Recipe: Terraform, AI, and a Pinch of MCP Teaching an Old DNS New IPv6 Tricks Dash-ing through the Klusters, in an AWS Console Google’s Generative AI Playground Gets a Glow-Up Vertex AI Studio: Now with 200% More Darkness! Like our souls Claude Opus 4 Strikes a Chord on Google Cloud Sovereign-teed to Please: Google Cloud’s Royal Treatment Google’s Cloud Kingdom Expands its Borders Shall I Compare Thee to a Summer’s AI? Anthropic Drops Sonne(t) 4 Knowledge on Vertex Mistral AI Chats Up a Storm on Google Cloud Google Cloud’s Vertex AI Gets a Dose of Mistral Magic .NET Aspire on Azure: The App Service Strikes Back Default Outbound Access Retires, Decides Florida Isn’t for Everyone  AI Is Going Great – or How ML Makes Money  01:52 Introducing Claude 4 Claude has launched the latest models in Claude Opus 4 and Claude Sonnet 4, setting new standards for coding, advancing reasoning and AI agents. Maybe they'll actually follow instructions when told to shut down? (Looking at you, ChatGPT.) Claude Opus 4 is “the world's best coding model” with sustained performance on complex, long-running tasks and agent workflows.  Opus 4 has 350 billion parameters, making it one of the largest publicly available language models.  It demonstrates strong performance on academic benchmarks, including research.  Sonnet 4 is a smaller 10 billion parameter model optimized for dialogue, making it well-suited for conversational AI applications.  Alongside the models, they are also announcing: Extended thinking with tool use (beta): Both models can use tools – like web search – during extended thinking, allowing Claude to alternate between reasoning and tool use to improve its responses. New Model Capabilities: Both models can use tools in parallel, follow instructions more precisely, and when given access to local files by developers — demonstrate significantly improved memory capabilities, extracting and saving key facts maintain continuity and build tacit knowledge over time Claude code is now generally available: After receiving extensive positive feedback during our research preview, they are expanding how developers can collaborate with Claude.  Claude code now supports background tasks via gith

The New Stack Podcast
Google Cloud Next Wrap-Up

The New Stack Podcast

Play Episode Listen Later May 22, 2025 18:22


At the close of this year's Google Cloud Next, The New Stack's Alex Williams, AI editor Frederic Lardinois, and analyst Janakiram MSV discussed the event's dominant theme: AI agents. The conversation focused heavily on agent frameworks, noting a shift from last year's third-party tools like Langchain, CrewAI, and Microsoft's Autogen, to first-party offerings from model providers themselves. Google's newly announced Agent Development Kit (ADK) highlights this trend, following closely on the heels of OpenAI's agent SDK. MSV emphasized the significance of this shift, calling it a major milestone as Google joins the race alongside Microsoft and OpenAI. Despite the buzz, Lardinois pointed out that many companies are still exploring how AI agents can fit into real-world workflows. The panel also highlighted how Google now delivers a full-stack AI development experience — from models to deployment platforms like Vertex AI. New enterprise tools like Agent Space and Agent Garden further signal Google's commitment to making agents a core part of modern software development. Learn more from The New Stack about the latest in AI agents: How AI Agents Will Change the Web for Users and Developers AI Agents: A Comprehensive Introduction for Developers AI Agents Are Coming for Your SaaS Stack Join our community of newsletter subscribers to stay on top of the news and at the top of your game. 

Supermanagers
AI Digs For Insights From Unstructured Data With Philippe Dame of Recollective

Supermanagers

Play Episode Listen Later May 1, 2025 65:34


Subscribe at Thisnewway.com to get the step-by-step AI workflows.In episode 3 of This New Way, Aydin sits down with Philippe Dame, CPO of Recollective, to unpack how AI is transforming qualitative market-research, sales operations, internal knowledge-sharing, and day-to-day productivity.Phil walks through the product pivot that turned Recollective's vast unstructured data into an “AI-first” insights engine, then demos a stack of no-code automations — from AI-powered lead scoring in Google Sheets to a self-serve Vertex AI search that makes every doc, deck, and Gong call instantly searchable.You'll hear concrete play-by-plays, see cost breakdowns , and learn how to start small, scale fast, and turn AI into a force-multiplier across your org.Timestamps:00:35 Phil's background and early web-tool days01:44 Pivot to Recollective and focus on market-research tech03:18 Why hybrid qual + quant research matters03:58 Unstructured data → perfect AI playground04:50 “Roadmap reset” after ChatGPT pressure06:00 How the team up-skilled on LLMs & vector DBs08:12 First AI features: summarization → theme extraction → comparisons09:05 Making space for AI work without derailing commitments10:10 Company-wide AI wins: sales data mining & lead scoring13:08 Relay + Google Sheets workflow for automated enrichment16:18 Running internal “AI office hours” to drive adoption17:05 Staying current: newsletters, trials, and cost control20:25 Seat-based vs. usage-based pricing—Phil's take23:04 Perplexity as Phil's go-to research sidekick24:50 Cutting the “collaboration tax” with self-serve AI answers27:24 Live demo: Recollective's Ask-AI tab & verbatim citations31:28 Segment @mentions for instant comparative analysis37:04 Emotion tagging and drilling into negative feedback38:30 Building an internal Vertex-AI search in one afternoon42:23 Agent Builder setup walkthrough44:34 Relay use-cases: lead workflows, news scraping, stand-up bot53:23 n8n migrations: 4,000 Gong calls plus on-the-fly analysis56:30 OpenAI Playground & Notebook LM for ad-hoc knowledgebases1:02:20 Google AI Studio multimodal experiments (free)1:04:04 Start simple—one use-case, one stakeholder, iterateTools & Resources Mentioned:AI / LLMs & Model-PlaygroundsChatGPT (OpenAI)OpenAI Platform & PlaygroundClaude (Anthropic)Perplexity Pro- Google Gemini (Workspace)Google AI StudioKnowledgeBase & Search Vertex AI Agent Builder / Search (Google Cloud) Notebook LM (Google) Internal Vertex-powered “ask-AI” portalAutomation & WorkflowsRelay (no-code workflow tool with AI steps)Zapier (reference point)n8n (open-source automation + AI agents)Data, CRM & Sales EnablementGoogle SheetsSalesforceOutreachGong (call recordings)Collaboration & ProductivitySlack (AI channel, human-in-the-loop flows)Notion (company intranet)Google Drive & Google CalendarRSS feeds + custom “Article Extractor” scraperCore ProductRecollective (Phil's qualitative-research platform with built-in AI features)Developer / Engineering UtilitiesCursor IDE (AI-assisted coding, briefly cited)

Tech Disruptors
Google Cloud CTO on LLM Demand Surge, Use Cases

Tech Disruptors

Play Episode Listen Later May 1, 2025 37:48


Since last year, Google has had 40x growth in Gemini use on its Vertex AI platform, highlighting the pace of demand in AI, says Will Grannis, chief technology officer of Google Cloud. In this episode of Tech Disruptors, Grannis sits down with Bloomberg Intelligence senior analyst Mandeep Singh to talk about the variety of use cases with large-language-model deployments. They discuss the company's Ironwood TPU launch to give an end-to-end stack perspective around inferencing workloads, and what it means for cloud demand.

The .NET Core Podcast
Google Gemini in .NET: The Ultimate Guide with Jochen Kirstaetter

The .NET Core Podcast

Play Episode Listen Later Apr 18, 2025 55:01


RJJ Software's Software Development Service This episode of The Modern .NET Show is supported, in part, by RJJ Software's Software Development Services, whether your company is looking to elevate its UK operations or reshape its US strategy, we can provide tailored solutions that exceed expectations. Show Notes "So on my side it was actually, the interesting experience was that I kind of used it one way, because it was mainly about reading the Python code, the JavaScript code, and, let's say like, the Go implementations, trying to understand what are the concepts, what are the ways about how it has been implemented by the different teams. And then, you know, switching mentally into the other direction of writing than the code in C#."— Jochen Kirstaetter Welcome friends to The Modern .NET Show; the premier .NET podcast, focusing entirely on the knowledge, tools, and frameworks that all .NET developers should have in their toolbox. We are the go-to podcast for .NET developers worldwide, and I am your host: Jamie “GaProgMan” Taylor. In this episode, Jochen Kirstaetter joined us to talk about his .NET SDK for interacting with Google's Gemini suite of LLMs. Jochen tells us that he started his journey by looking at the existing .NET SDK, which didn't seem right to him, and wrote his own using the HttpClient and HttpClientFactory classes and REST. "I provide a test project with a lot of tests. And when you look at the simplest one, is that you get your instance of the Generative AI type, which you pass in either your API key, if you want to use it against Google AI, or you pass in your project ID and location if you want to use it against Vertex AI. Then you specify which model that you like to use, and you specify the prompt, and the method that you call is then GenerateContent and you get the response back. So effectively with four lines of code you have a full integration of Gemini into your .NET application."— Jochen Kirstaetter Along the way, we discuss the fact that Jochen had to look into the Python, JavaScript, and even Go SDKs to get a better understanding of how his .NET SDK should work. We discuss the “Pythonistic .NET” and “.NETy Python” code that developers can accidentally end up writing, if they're not careful when moving from .NET to Python and back. And we also talk about Jochen's use of tests as documentation for his SDK. Anyway, without further ado, let's sit back, open up a terminal, type in `dotnet new podcast` and we'll dive into the core of Modern .NET. Supporting the Show If you find this episode useful in any way, please consider supporting the show by either leaving a review (check our review page for ways to do that), sharing the episode with a friend or colleague, buying the host a coffee, or considering becoming a Patron of the show. Full Show Notes The full show notes, including links to some of the things we discussed and a full transcription of this episode, can be found at: https://dotnetcore.show/season-7/google-gemini-in-net-the-ultimate-guide-with-jochen-kirstaetter/ Jason's Links: JoKi's MVP Profile JoKi's Google Developer Expert Profile JoKi's website Other Links: Generative AI for .NET Developers with Amit Bahree curl Noda Time with Jon Skeet Google Cloud samples repo on GitHub Google's Gemini SDK for Python Google's Gemini SDK for JavaScript Google's Gemini SDK for Go Vertex AI JoKi's base NuGet package: Mscc.GenerativeAI JoKi's NuGet package: Mscc.GenerativeAI.Google System.Text.Json gcloud CLI .NET Preprocessor directives .NET Target Framework Monikers QUIC protocol IAsyncEnumerable Microsoft.Extensions.AI Supporting the show: Leave a rating or review Buy the show a coffee Become a patron Getting in Touch: Via the contact page Joining the Discord Remember to rate and review the show on Apple Podcasts, Podchaser, or wherever you find your podcasts, this will help the show's audience grow. Or you can just share the show with a friend. And don't forget to reach out via our Contact page. We're very interested in your opinion of the show, so please get in touch. You can support the show by making a monthly donation on the show's Patreon page at: https://www.patreon.com/TheDotNetCorePodcast. Music created by Mono Memory Music, licensed to RJJ Software for use in The Modern .NET Show

Everyday AI Podcast – An AI and ChatGPT Podcast
EP 503: Google goes AI nuts, OpenAI countersues Elon, Canva drops new AI features and more AI News That Matters

Everyday AI Podcast – An AI and ChatGPT Podcast

Play Episode Listen Later Apr 14, 2025 57:25


Google went AI nuts at Cloud Next, possibly taking the lead. OpenAI is reportedly ready to unveil up to five new models. Canva enters the AI arena with innovative features. This week's AI news is explosive. Catch up now!Newsletter: Sign up for our free daily newsletterMore on this Episode: Episode PageJoin the discussion: Thoughts on the news? Join the convo.Upcoming Episodes: Check out the upcoming Everyday AI Livestream lineupWebsite: YourEverydayAI.comEmail The Show: info@youreverydayai.comConnect with Jordan on LinkedInTopics Covered in This Episode:Google Cloud Next AI Announcements RecapOpenAI ChatGPT Memory Feature DetailsOpenAI and Elon Musk Legal BattleCanva AI Suite Expansion OverviewAnthropic Claude Max Subscription PricingMicrosoft's Data Center Strategy PivotShopify's AI Usage Mandatory PolicyUpcoming OpenAI Model Releases OverviewTimestamps:00:00 Technical Glitch with Equipment04:48 Gemini 2.5 Pro Launch07:06 Google's New AI Collaboration Protocols13:28 ChatGPT Enhances Memory for Personalization17:37 AI Surveillance Accusations in U.S. Agencies20:56 Canva Launches AI-Powered Suite23:10 AI Graphic Design Evolution26:02 "Musk's Lawsuit: A Delay Tactic"28:14 Anthropic Launches Claude Max Subscription34:05 Microsoft Pauses Data Center Expansion35:39 Microsoft's $80B AI Investment Strategy42:05 Shopify's Bold AI Integration Shift44:25 Maximize AI Before Hiring48:31 OpenAI Model Tiers Explained51:41 "GPT-5: Concerns on Model Autonomy"54:20 AI Innovations and Controversies OverviewKeywords:Google Cloud Next, AI updates, OpenAI, countersue, Elon Musk, Canva AI features, Gemini 2.5 Pro, Large Language Model, ChatGPT memory feature, AI race, GPT 4.1, Vertex AI, Google AI Studio, agent to agent protocol, Google Workspace, Google Sheets, MCP protocol, Google DeepMind, GDC, Ironwood TPU chip, Lyria AI model, AI video model, AI music generation, Elon Musk's Dodge team, government AI monitoring, Ethical AI use, Canva Sheets, Shopify CEO AI memo, Anthropic, Claude Max, Microsoft Copilot, AI infrastructure, Recall AI feature, data privacy concerns, AI-powered productivity, GPT models, AI operating systems, personalized AI, GMPT 4.5, AI sandbox, Nvidia hardware, test time computing, AI reasoning, ChatGPT preferences.Send Everyday AI and Jordan a text message. (We can't reply back unless you leave contact info) Ready for ROI on GenAI? Go to youreverydayai.com/partner

The Official SaaStr Podcast: SaaS | Founders | Investors
SaaStr 796: The Secrets Inside Google Cloud's Growth with Sarah Kennedy, Vice President Google Cloud Marketing

The Official SaaStr Podcast: SaaS | Founders | Investors

Play Episode Listen Later Mar 26, 2025 36:01


SaaStr 796: The Secrets Inside Google Cloud's Growth with Sarah Kennedy, Vice President Google Cloud Marketing   In our latest episode of the SaaStr What's New series, SaaStr CEO and founder Jason Lemkin spoke with Sarah Kennedy, VP of Google Cloud Marketing. The conversation explores the explosive growth of Google Cloud and what's driving this momentum. Kennedy highlights the critical role AI plays in their success, from Google's world-class infrastructure to the cutting-edge AI models like Vertex AI and Gemini. We dive into the specifics of why startups and enterprises are increasingly choosing Google Cloud, the importance of customer-centric strategies, and the shift towards developer-led decisions. We also explore Google Cloud's major partnership with Salesforce and how AI and security are transforming business strategies. Tune in for insights on how Google Cloud is shaping the future of AI and stay ahead of the curve with expert tips on leveraging these technologies for your business. -------------------------------------------------------------------------------------------   Alright everybody in SaaS, this is it.  The biggest, best, most action-packed SaaS + AI event of the year—SaaStr Annual 2025—is coming this May. Three full days. 10,000+ SaaS and AI leaders and more tactical, no-fluff content than you'll find anywhere else.   If you want to scale faster—$10M, $50M, $100M ARR and beyond—you need the right playbooks, the right connections and the right people in your corner. And SaaStr Annual is where it all happens. We'll have 100's of Legendary speakers from companies like Snowflake, HubSpot, OpenAI, Canva, and more. More networking than you can handle—meet your next investor, co-founder, or biggest deal.  A New AI Demo & Pitch Stage— with your chance to win up to $5M in funding!  So don't wait—grab your tickets now at SaaStrAnnual.com with my code jason100 to save $100 on tickets before prices go up. That's jason 100 at saastrannual.com   See you in May!    --------------------------------------------------------------------------------------------   Do you know what would make your customer service helpdesk dramatically better? Dumping it and switching to Intercom.  But, youʼre not quite ready to make that change. We get it!   Thatʼs why Fin, the worldʼs leading AI customer service agent, is now available on every helpdesk.   Fin can instantly resolve up to 80% of your tickets,  Which makes your customers happier. And you can get off the customer service rep hiring treadmill.   Fin by Intercom. Named the #1 AI Agent in G2ʼs Winter Report.      Learn more at : inter.com/saastr   --------------------------------------------------------------------------------------------

Daily Tech News Show
Discord Announces Social SDK For Game Developers - DTH

Daily Tech News Show

Play Episode Listen Later Mar 17, 2025 4:29


Google's Chirp 3 is coming to Vertex AI, Roblox announces text-to-shape generator Cube 3D, Alphabet spins off laser internet startup Taara. Show Notes

Daily Tech Headlines
Discord Announces Social SDK For Game Developers – DTH

Daily Tech Headlines

Play Episode Listen Later Mar 17, 2025


Google's Chirp 3 is coming to Vertex AI, Roblox announces text-to-shape generator Cube 3D, Alphabet spins off laser internet startup Taara. MP3 Please SUBSCRIBE HERE for free or get DTNS Live ad-free. A special thanks to all our supporters–without you, none of this would be possible. If you enjoy what you see you can supportContinue reading "Discord Announces Social SDK For Game Developers – DTH"

Everyday AI Podcast – An AI and ChatGPT Podcast
EP 449: Can Claude's AI Agent Simplify Your Work? A Live Test Drive

Everyday AI Podcast – An AI and ChatGPT Podcast

Play Episode Listen Later Jan 29, 2025 41:17


Send Everyday AI and Jordan a text messageWondering if Claude's latest agentic AI is worth it? Computer Use is an agentic AI system that allows you to operate a virtual computer simply by speaking with Claude. We dive in and explain how it works. Newsletter: Sign up for our free daily newsletterMore on this Episode: Episode PageJoin the discussion: Ask Jordan questions on Claude AIUpcoming Episodes: Check out the upcoming Everyday AI Livestream lineupWebsite: YourEverydayAI.comEmail The Show: info@youreverydayai.comConnect with Jordan on LinkedInTopics Covered in This Episode:1. Overview of Anthropic Claude2. How to Use Claude Computer Use3. Critiques of Anthropic's Tools4. Future of AI AgentsTimestamps:00:00 AI agents essential in businesses by 2025.04:48 Google developing AI agent 'Jarvis'; competition intensifies.10:01 Using an API key; GitHub shares code.11:22 Docker is a versatile containerization tool for developers.15:36 Claude Sonnet 3.5 limits commands despite plans.17:08 Replace placeholder with copied API key.23:17 Demonstrating computer vision on a virtual desktop.25:33 Claude retained information without website visit.29:31 Experiencing repeated errors toggling between applications.30:49 Visit everydayai.com, list latest 3 episodes.35:10 Word document created with AI episode summaries.37:12 Direct AI with simple code; needs improvement.Keywords:Jordan Wilson, Claude AI, language model, Everyday AI Podcast, podcast summaries, document formatting, model interaction, AI errors, AI execution challenges, API key, Docker usage, virtual desktop, Word document creation, live stream, Anthropic updates, Claude free plan, API key security, Docker installation, Service tier levels, GitHub repositories, AI in Business, Claude's updates, Google Project Jarvis, OpenAI, Microsoft, Salesforce Agent Force, Amazon Bedrock, Google Cloud's Vertex AI, AI agents, Application Programming Interfaces. Ready for ROI on GenAI? Go to youreverydayai.com/partner

The Cloud Pod
288: You Might Be Able to Retrain Notebook LM Hosts to be Less Annoyed, But Not Your Cloud Pod Hosts

The Cloud Pod

Play Episode Listen Later Jan 22, 2025 56:25


Welcome to episode 288 of The Cloud Pod – where the forecast is always cloudy! Justin, Ryan, and Jonathan are your hosts as we make our way through this week's cloud and AI news, including back to Vertex AI, Project Digits, Notebook LM, and some major improvements to AI image generation.  Titles we almost went with this week: Digits… I'll show you 5 digits… The only digit the AWS local zone in New York shows me is the middle one Keep one eye open near Mercedes with Agentic AI A big thanks to this week's sponsor: We're sponsorless! Want to get your brand, company, or service in front of a very enthusiastic group of cloud news seekers? You've come to the right place! Send us an email or hit us up on our slack channel for more info.  General News 01:59 Nvidia announces $3,000 personal AI supercomputer called Digits If you don't want to hand over all your money to the cloud providers, you will be able to hand over $3,000 dollars to Nvidia… for a computer that is probably going to be obsolete in

The Automotive Troublemaker w/ Paul J Daly and Kyle Mountsier
Banning Russian Car Hardware, Google “Empathetic” Auto AI, Target Slashes Production Timelines

The Automotive Troublemaker w/ Paul J Daly and Kyle Mountsier

Play Episode Listen Later Jan 14, 2025 13:06


Shoot us a Text.9 days to NADA and you can feel the anticipation around the social media halls. Today, we're talking about how the US Commerce Department is banning Chinese and Russian car hardware and software, Google's new automotive AI agent debuting in the Mercedes CLA and Target changing production timelines to match social media trends.Show Notes with links:The U.S. government has finalized a sweeping ban on the use of Chinese and Russian-made hardware and software in internet-connected vehicles to bolster national security and protect consumer privacy.The Commerce Department will ban Chinese and Russian connectivity hardware in 2030 models and driving software from 2027 models.Manufacturers tied to China and Russia are also prohibited from selling connected vehicles in the U.S.Commercial vehicles, such as trucks and buses, are not yet covered but will be addressed soon.Secretary Gina Raimondo stressed the ban as a measure to protect national security and American privacy. “This is a targeted approach to ensure we keep PRC and Russian-manufactured technologies off American roads,” Google Cloud has unveiled its Automotive AI Agent platform, debuting in the new Mercedes CLA. The advanced system promises seamless, conversational interactions tailored for driver with enhanced natural language processing.The next-gen MBUX Virtual Assistant has four “personality traits” (natural, predictive, personal, empathetic) and can ask clarifying questions to improve responses.Powered by Google's Gemini and Vertex AI, it offers real-time Google Maps updates, restaurant reviews, recommendations, and handles multi-turn dialogue.Older Mercedes models with MBUX Voice Assistant may receive updates incorporating ChatGPT and Bing, though without full conversational AI features.“This is just the beginning of how agentic capabilities can transform the automotive industry,” said Sundar Pichai, Google CEO.Target is speeding up its production process, slashing timelines from 27 weeks to just eight, to keep pace with consumer demands and trends driven by digital giants like Shein and Temu.Target's new model responds to rapidly shifting social media trends, aiming to match fast fashion's quick go-to-market strategies.For example, Target recently pivoted from decorative bows to cherry-themed holiday apparel, responding to consumer demand in time for the season.Innovations in supply chain and design allow Target to cut product development cycles by nearly 70%.“The next chapter in retail is going to be about innovation, newness, creativity,” said Rick Gomez, Target's Chief Commerce Officer.Hosts: Paul J Daly and Kyle MountsierGet the Daily Push Back email at https://www.asotu.com/ JOIN the conversation on LinkedIn at: https://www.linkedin.com/company/asotu/ Read our most recent email at: https://www.asotu.com/media/push-back-email

Diabetes Connections with Stacey Simms Type 1 Diabetes
In the News... Inhaled Insulin Studied for Kids, Dexcom Launches AI, App for Driving & T1D, and more!

Diabetes Connections with Stacey Simms Type 1 Diabetes

Play Episode Listen Later Dec 20, 2024 6:25


It's In the News.. a look at the top headlines and stories in the diabetes community. This week's top stories: Mannkind releases info about it's Afrezza pediatric studies, Dexcom launches AI tech with Stelo, Health Canada approves Tandem/Dexcom G7, diabetes drug may help sleep apnea, an app in development to help drivers with T1D and more! Find out more about Moms' Night Out  Please visit our Sponsors & Partners - they help make the show possible! Learn more about Gvoke Glucagon Gvoke HypoPen® (glucagon injection): Glucagon Injection For Very Low Blood Sugar (gvokeglucagon.com) Omnipod - Simplify Life Learn about Dexcom  Edgepark Medical Supplies Check out VIVI Cap to protect your insulin from extreme temperatures Learn more about AG1 from Athletic Greens  Drive research that matters through the T1D Exchange The best way to keep up with Stacey and the show is by signing up for our weekly newsletter: Sign up for our newsletter here Here's where to find us: Facebook (Group) Facebook (Page) Instagram Twitter Check out Stacey's books! Learn more about everything at our home page www.diabetes-connections.com  Reach out with questions or comments: info@diabetes-connections.com Episode transcription with links: Hello and welcome to Diabetes Connections In the News! I'm Stacey Simms and every other Friday I bring you a short episode with the top diabetes stories and headlines happening now. XX Mannkid expects to talk to the FDA about Afrezza inhaled insulin for pediatric approval early in 2025. The company just announced six-month results from its Phase 3 INHALE-1 study of kids aged 4-17 with type 1 or type 2 diabetes comparing either inhaled pre-meal insulin or multiple daily injections (MDI) of rapid-acting insulin analog, both in combination with basal insulin. A 26-week extension phase in which all remaining MDI patients were switched to inhaled insulin is ongoing. HbA1c change over 26 weeks exceeded the prespecified non-inferiority margin of 0.4% (0.435%), largely driven by the variability of a single patient who did not adhere to the study protocol. A modified ITT (mITT) analysis, which excluded this subject, did not exceed the predetermined threshold of 0.4% (0.370%), thereby establishing the non-inferiority of Afrezza to MDI, which was the primary endpoint of the study. Over 26 weeks of treatment, there were no differences in lung function parameters between the treatment groups, There were no differences between groups or concerns in other safety measures, including hypoglycemia. https://www.medscape.com/viewarticle/inhaled-insulin-benefits-kids-diabetes-too-2024a1000nex   XX Dexcom announces the use of AI for its Stelo platform. The company says the new Dexcom GenAI platform will analyze individual health data patterns to reveal a direct association between lifestyle choices and glucose levels while providing actionable insights to help improve metabolic health. Stelo users will start seeing the features this week. The AI is modeled after Google Cloud's Vertex AI and Gemini models. We'll hear more about this in January – Dexcom will be part of a panel at the Consumer Electronics Show about AI and healthcare. BTW this press release is the first time I've seen what seems to be a new slogan for Dexcom – Discover What You're Made Of. https://www.businesswire.com/news/home/20241217011997/en/Dexcom-Launches-the-First-Generative-AI-Platform-in-Glucose-Biosensing XX Staying with Dexcom, users report that the geofencing issue we reported on seems to be resolved. Previously, if you had an issue with Dexcom G7 outside of your home country, you couldn't reinstall or use the app without customer support. With the latest iOS and Android G7 apps, this seems to be resolved. This is according to the folks in the DIY community who first brought it to my attention.   XX Interesting insulin development to watch. Egypt approves EVA Pharma's insulin drug products, which is a collbaration between Eli llly and EVA, an Egyptian company. The Egyptian Drug Authority approved the insulin glargine injection manufactured by EVA Pharma through a collaboration with Eli Lilly and Company (NYSE: LLY). Launched in 2022, the collaboration aims to deliver a sustainable supply of high-quality, affordable human and analog insulin to at least one million people annually living with type 1 and type 2 diabetes in low- to middle-income countries (LMICs), most of which are in Africa.   Lilly has been supplying its active pharmaceutical ingredient (API) for insulin to EVA Pharma at a significantly reduced price and providing pro-bono technology transfer to enable EVA Pharma to formulate, fill and finish insulin vials and cartridges. This collaboration is part of the Lilly 30x30 initiative, which aims to improve access to quality health care for 30 million people living in resource-limited settings annually by 2030. https://www.prnewswire.com/news-releases/lilly-and-eva-pharma-announce-regulatory-approval-and-release-of-locally-manufactured-insulin-in-egypt-302333269.html     XX Can we add treating sleep apnea to the list of applications for terzepatide? That's the generic for Zepbound and Mounjaro. Phase 3 study shows that 10- and 15-milligram injections of Zepbound "significantly reduced the apnea-hypopnea index" among those who have obesity and moderate-to-severe obstructive sleep apnea. Eli Lilly said there was nearly a 20% reduction in weight among those in the trials. The company said it plans to submit its findings to the Food and Drug Administration and other global regulatory agencies beginning mid-year. https://www.aol.com/popular-weight-loss-drug-could-131507702.html   XX Health Canada okays Tandem's tslim X2 with Dexcom G7 and G6 making it the first and only insulin pump in Canada that is integrated with both Dexcom sensors. Now, t:slim X2 users in Canada can experience even more choice when it comes to CGM compatibility, along with the option to spend more time in closed loop with Dexcom G7's 30-minute sensor warm-up time, faster than any other CGM on the market.3 In addition, t:slim X2 users who pair Dexcom G7 with an Apple smartwatch4 can see their glucose numbers directly from their watch without having to access their pump or smartphone4. Tandem will email all in-warranty t:slim X2 users in Canada with instructions on how to add the new compatibility feature free of charge via remote software update. t:slim X2 pumps pre-loaded with the updated software will begin shipping to new customers in early January 2025.   To check coverage and start the process of getting a Tandem insulin pump, please visit tandemdiabetes.ca. https://www.businesswire.com/news/home/20241210731189/en/Tandem-tslim-X2-Insulin-Pump-Now-Compatible-with-Dexcom-G7-CGM-in-Canada XX A federal jury on Tuesday awarded Insulet $452 million in its patent skirmish with EOFlow over insulin patch pumps. The jury awarded Insulet $170 million in compensatory damages from EOFlow and an additional $282 million in exemplary damages for willful and malicious misappropriation. A judge has not yet entered a judgment on the decision. Insulet filed a lawsuit in the U.S. District Court for the District of Massachusetts in 2023, claiming EOFlow copied patented components of its Omnipod insulin pumps. In October 2023, the Massachusetts district court issued a preliminary injunction against EOFlow. Following that decision, Medtronic called off plans to buy EOFlow for about $738 million.   A federal appeals court later overturned the preliminary injunction, and EOFlow resumed selling its devices in Europe. The company recently defended against a separate injunction filed by Insulet in Europe's Unified Patent Court, according to Korea Biomedical Review, an online English newspaper based in Seoul, South Korea.   The Massachusetts jury found this week that EOFlow and CEO Jesse Kim, as well as two of three former Insulet employees who were named as defendants in the lawsuit, misappropriated Insulet's trade secrets.   Insulet CEO Jim Hollingshead said the company is “extremely pleased with the jury's verdict.” EOFlow did not immediately respond to a request for comment. https://www.medtechdive.com/news/insulet-eoflow-jury-verdict-patent-lawsuit/734745/ XX A tele-education program for health care providers who treat people with diabetes resulted in significant improvements in patient outcomes, including better blood sugar levels and increased use of medical devices to manage the disease, a University of Florida study finds. Led by researchers in the UF College of Public Health and Health Professions and the UF College of Medicine, the program used the Extension for Community Health Care Outcomes model, which has been adopted worldwide to train clinicians who treat patients with a variety of conditions. Known as Project ECHO, this is one of the first to demonstrate patient benefits for the program in a large, randomized trial. The findings appear in the journal Diabetes Care. https://ufhealth.org/news/2024/clinician-training-program-leads-to-better-outcomes-for-patients-with-diabetes XX New app under development to make driving safer for people with diabetes. Diabetes Driving Pal says it will use CGM data and guide you while you are driving without any annoying alerts. Guidance/suggestions will be on your car dashboard so that you don't have to look at phone and it will be very individualized and actionable. In a study last year, ~70% of people have reported (5% reported accident) to have at least one low blood sugar while driving and most reported that CGM alerts were not enough to protect them. We are hoping to start beta testing in a few months. We are trying to raise the fund to develop this product. We need your support. For more information, please visit: https://lnkd.in/gTDhnDc4 XX I'm also going to link to the top ten most read diabetes and endocrinology stories of 2024 from Medscape. This is almost all GLP-1 related.. and mostly for people with type 2. https://www.medscape.com/viewarticle/icymi-top-10-diabetes-endocrinology-stories-2024-2024a1000n6u?&icd=login_success_email_match_fpf XX That's it for the last In the News of 2024! Don't miss out episode next week with a look ahead to what we're watching in 2025. I'm SS I'll see you back here soon…

Everyday AI Podcast – An AI and ChatGPT Podcast
EP 390: How to use Claude's AI ‘Computer use' for everyday people

Everyday AI Podcast – An AI and ChatGPT Podcast

Play Episode Listen Later Oct 29, 2024 41:05


Send Everyday AI and Jordan a text messageWanna learn Claude's new agentic AI? Got 30ish minutes? This is the show for you then. In short -- Computer Use is an agentic AI system where you can control a virtual computer just by talking to Claude. Join us as we break it down.  Newsletter: Sign up for our free daily newsletterMore on this Episode: Episode PageJoin the discussion: Ask Jordan questions on Claude AIUpcoming Episodes: Check out the upcoming Everyday AI Livestream lineupWebsite: YourEverydayAI.comEmail The Show: info@youreverydayai.comConnect with Jordan on LinkedInTopics Covered in This Episode:1. Overview of Anthropic Claude2. How to Use Claude Computer Use3. Critiques of Anthropic's Tools4. Future of AI AgentsTimestamps:00:00 AI agents essential in businesses by 2025.04:48 Google developing AI agent 'Jarvis'; competition intensifies.10:01 Using an API key; GitHub shares code.11:22 Docker is a versatile containerization tool for developers.15:36 Claude Sonnet 3.5 limits commands despite plans.17:08 Replace placeholder with copied API key.23:17 Demonstrating computer vision on a virtual desktop.25:33 Claude retained information without website visit.29:31 Experiencing repeated errors toggling between applications.30:49 Visit everydayai.com, list latest 3 episodes.35:10 Word document created with AI episode summaries.37:12 Direct AI with simple code; needs improvement.Keywords:Jordan Wilson, Claude AI, language model, Everyday AI Podcast, podcast summaries, document formatting, model interaction, AI errors, AI execution challenges, API key, Docker usage, virtual desktop, Word document creation, live stream, Anthropic updates, Claude free plan, API key security, Docker installation, Service tier levels, GitHub repositories, AI in Business, Claude's updates, Google Project Jarvis, OpenAI, Microsoft, Salesforce Agent Force, Amazon Bedrock, Google Cloud's Vertex AI, AI agents, Application Programming Interfaces. Get more out of ChatGPT by learning our PPP method in this live, interactive and free training! Sign up now: https://youreverydayai.com/ppp-registration/

Everyday AI Podcast – An AI and ChatGPT Podcast
Ep 386: Claude 3.5 Sonnet Updates - AI can use computers now?

Everyday AI Podcast – An AI and ChatGPT Podcast

Play Episode Listen Later Oct 23, 2024 52:40


Send Everyday AI and Jordan a text messageAI can use computers now? Yup. With Claude 3.5 Sonnet updates, Anthropic's LLM now has access to 'Computer Use.' Is this new mode going to change how we use LLMs? And what else is noteworthy with Claude's new updates in 3.5? We'll go over it all. Newsletter: Sign up for our free daily newsletterMore on this Episode: Episode PageJoin the discussion: Ask Jordan questions on Anthropic ClaudeUpcoming Episodes: Check out the upcoming Everyday AI Livestream lineupWebsite: YourEverydayAI.comEmail The Show: info@youreverydayai.comConnect with Jordan on LinkedInTopics Covered in This Episode:1. Claude 3.5 Updates2. Computer Use Feature3. API and Pricing4. Model Benchmarks5. Potential for Business ApplicationsTimestamps:02:15 Daily AI news05:10 New updates from Anthropic06:32 Claude excels in human-like writing, lacks connectivity.09:56 Claude 3.5 updates: SONNET new, now labeled.11:36 New computer use excels with unstructured data.14:39 Discuss Anthropic's unique API and pricing strategy.18:13 Claw 3.5 SONNET excels in benchmark comparisons.23:07 Cherry-picking without fair benchmarks undermines credibility.26:33 PPP course improves prompt usage effectively.27:37 Model omitted; operates logically using chain-of-thought.31:17 Anthropic omitted model to avoid poor benchmarks.37:09 Automated research and planning for sunrise viewing.39:40 New tech handles errors; works with unstructured data.43:44 Utilizes screenshots for computer vision, correcting issues.46:02 Using the API quickly exhausts token limits.48:38 Evaluate potential business impact of Anthropic's feature.Keywords:Anthropic, AI technology, programming a virtual computer, future implications for businesses, OpenAI, shipping product in beta, SONNET 35, Haiku 35, AI in future work environments, daily AI newsletter, computer use feature, Robotics Process Automation (RPA), API and Pricing, Claude 3.5 SONNET, benchmarks, community engagement, Jordan Wilson, Claude's natural language interface, Docker, Amazon Bedrock, Google Cloud's Vertex AI, MMLU Benchmark, Coding Benchmark, Math Problem Solving, Chain of Thought Reasoning, Host's Opinion, Prime Prompt Polish Course, Stability AI, Midjourney, Canva Get more out of ChatGPT by learning our PPP method in this live, interactive and free training! Sign up now: https://youreverydayai.com/ppp-registration/

Everyday AI Podcast – An AI and ChatGPT Podcast
EP 382: Why AI Literacy is Essential for Parents and Kids in Education and Beyond

Everyday AI Podcast – An AI and ChatGPT Podcast

Play Episode Listen Later Oct 17, 2024 32:30


Send Everyday AI and Jordan a text messageThe AI revolution is here, transforming classrooms, homes, and how your kids learn and interact with the world. From personalized learning tools to AI-powered homework help, education is changing fast—but are you prepared to guide your kids through this shift? Stephanie Worrell, Founder of AI-MPOWERU, joins us to explain why AI literacy is critical for both parents and kids. Newsletter: Sign up for our free daily newsletterMore on this Episode: Episode PageJoin the discussion: Ask Jordan and Stephanie questions on AI literacyUpcoming Episodes: Check out the upcoming Everyday AI Livestream lineupWebsite: YourEverydayAI.comEmail The Show: info@youreverydayai.comConnect with Jordan on LinkedInTopics Covered in This Episode:1. Challenges in AI Education2. Parental Concerns about AI3. Risks and Safety Concerns of AI in Education4. Advice for Parents on AI5. AI Literacy in Higher EducationTimestamps:01:40 Daily AI news05:00 About Stephanie and AI-MPOWERU07:28 Students need AI skills integrated into education.12:53 Using AI enhanced education and job applications.15:29 AI risks: deepfakes, relationships, education, social media.19:21 Collaborative AI learning enhances education but concerns exist.20:26 AI influences social media, affects mental health.24:30 Prepare students for AI-dominated job market.27:30 Integrate generative AI into educational curricula.30:45 Prepare kids for future digital challenges.Keywords:AI and children, Jordan Wilson, Everyday AI, Google Cloud, Vertex AI, NVIDIA AI model, Perplexity, The New York Times, AI copyright concerns, Guest Stephanie Worrell, AI Empower You, AI literacy, Raising AI Smart Kids, AI in education, Parental concerns, Plagiarism in AI, ChatGPT, Internet safety, Risk of AI, Deepfakes, AI and mental health, AI personalization, AI in college, Grammarly, AI transparency, Ethical AI use, Future job landscape, Social media and AI, AI syllabi integration, AI literacy newsletter. Get more out of ChatGPT by learning our PPP method in this live, interactive and free training! Sign up now: https://youreverydayai.com/ppp-registration/