POPULARITY
Categories
Our 230th episode with a summary and discussion of last week's big AI news!Recorded on 01/02/2026Hosted by Andrey Kurenkov and Jeremie HarrisFeel free to email us your questions and feedback at contact@lastweekinai.com and/or hello@gladstone.aiRead out our text newsletter and comment on the podcast at https://lastweekin.ai/In this episode:Nvidia's acquisition of AI chip startup Groq for $20 billion highlights a strategic move for enhanced inference technology in GPUs.New York's RAISE Act legislation aims to regulate AI safety, marking the second major AI safety bill in the US.The launch of GLM 4.7 by Zhipu AI marks a significant advancement in open-source AI models for coding.Evaluation of long-horizon AI agents raises concerns about the rising costs and efficiency of AI in performing extended tasks.Timestamps:(00:00:10) Intro / Banter(00:01:58) 2025 RetrospectiveTools & Apps(00:24:39) OpenAI bets big on audio as Silicon Valley declares war on screens | TechCrunchApplications & Business(00:26:39) Nvidia buying AI chip startup Groq for about $20 billion, biggest deal(00:34:28) Exclusive | Meta Buys AI Startup Manus, Adding Millions of Paying Users - WSJ(00:38:05) Cursor continues acquisition spree with Graphite deal | TechCrunch(00:39:15) Micron Hikes CapEx to $20B with 2026 HBM Supply Fully Booked; HBM4 Ramps 2Q26(00:42:06) Chinese fabs are reportedly upgrading older ASML DUV lithography chipmaking machines — secondary channels and independent engineers used to soup up Twinscan NXT seriesProjects & Open Source(00:47:52) Z.AI launches GLM-4.7, new SOTA open-source model for coding(00:50:11) Evaluating AI's ability to perform scientific research tasksResearch & Advancements(00:54:32) Large Causal Models from Large Language Models(00:57:33) Universally Converging Representations of Matter Across Scientific Foundation Models(01:02:11) META-RL INDUCES EXPLORATION IN LANGUAGE AGENTS(01:07:16) Are the Costs of AI Agents Also Rising Exponentially?(01:11:17) METR eval for Opus 4.5(01:16:19) How to game the METR plotPolicy & Safety(01:17:24) New York governor Kathy Hochul signs RAISE Act to regulate AI safety | TechCrunch(01:20:40) Activation Oracles: Training and Evaluating LLMs as General-Purpose Activation Explainers(01:26:46) Monitoring Monitorability(01:32:07) Sam Altman is hiring someone to worry about the dangers of AI | The Verge(01:33:38) X users asking Grok to put this girl in bikini, Grok is happy obliging - India TodaySee Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.
You still using AI to..... write emails?
Confira os destaques do Jornal da Manhã desta segunda-feira (05): O ditador da Venezuela, Nicolás Maduro, deve comparecer pela primeira vez a um tribunal em Nova York às 14h desta segunda-feira (5), no horário de Brasília. O comparecimento ocorre após o Departamento de Justiça americano divulgar, no sábado (03), uma nova acusação contra Maduro, que integra um processo criminal por tráfico de drogas movido pelo governo dos EUA há cerca de 15 anos. Reportagem: Teresa Morrone. O Conselho de Segurança da Organização das Nações Unidas (ONU), formado por 15 países, deve se reunir nesta segunda-feira (05), por volta das 12h, no horário de Brasília, para discutir a legalidade da captura do ditador venezuelano, Nicolás Maduro, pelas forças dos Estados Unidos. Maduro foi preso na madrugada do último sábado (03) durante uma operação de forças especiais norte-americanas. Reportagem: Rany Veloso. O controle do petróleo da Venezuela tornou-se um novo desafio para os Estados Unidos no cenário político e estratégico internacional. O secretário de Estado dos Estados Unidos, Marco Rubio, afirmou que os EUA estão prontos para trabalhar com líderes remanescentes do país, desde que tomem as “decisões corretas”, em referência a mudanças políticas e institucionais. Rubio negou que a Casa Branca tenha qualquer intenção de governar Caracas, mas garantiu que os bloqueios ao setor de petróleo irão prosseguir. Reportagem: Misael Mainetti. A ofensiva dos Estados Unidos contra a Venezuela, que resultou na prisão do ditador Nicolás Maduro, acendeu o debate sobre os impactos geopolíticos para a América Latina. Em entrevista, o mestre em Relações Internacionais, Valdir da Silva Bezerra, analisa os riscos da ação americana, as possíveis reações de governos da região e os efeitos sobre a estabilidade política, econômica e diplomática do continente. Reportagem: Daniel Lian. Moradores da Venezuela relatam trauma após ataques aéreos dos Estados Unidos que atingiram bairros operários. Os bombardeios antecederam a prisão do presidente Nicolás Maduro e provocaram forte impacto psicológico na população. Reportagem: Pedro Veraldi. O diplomata e analista político Edmundo González, que se declarou presidente da Venezuela após as eleições de 2024, disse neste domingo (04) ser o novo presidente do país. Em vídeo divulgado nas redes sociais, ele pediu que as Forças Armadas reconheçam o resultado do pleito e reafirmou a sua vitória, em um cenário de forte tensão institucional após a prisão de Nicolás Maduro. Reportagem: Eliseu Caetano. Os usuários do Bilhete Único em São Paulo têm até às 23h59 desta segunda-feira (05) para fazer a recarga e garantir o valor antigo de R$ 5,00 na tarifa de ônibus por até 180 dias. A partir da 0h de terça-feira (06), a passagem sobe para R$ 5,30 na capital paulista. O reajuste também atinge os trens e o Metrô, cujas tarifas passam de R$ 5,20 para R$ 5,40, conforme anunciado pelo governo do estado. Reportagem: Beatriz Manfredini. Protestos contra o alto custo de vida deixaram mortos e se espalharam por dezenas de cidades do Irã, segundo relatos de agências internacionais e organizações de direitos humanos. As manifestações refletem o descontentamento popular com a inflação, o desemprego e a crise econômica que atinge o país. Reportagem: Eliseu Caetano. O presidente dos Estados Unidos, Donald Trump, afirmou que pretende contar com empresas americanas para reconstruir a indústria petrolífera da Venezuela, duramente afetada por sanções e pela crise política. Segundo Trump, petroleiras dos EUA serão autorizadas a atuar no país após a operação militar que resultou na captura de Nicolás Maduro. Reportagem: Rodrigo Viga. Essas e outras notícias você acompanha no Jornal da Manhã. Learn more about your ad choices. Visit megaphone.fm/adchoices
When METR says something like "Claude Opus 4.5 has a 50% time horizon of 4 hours and 50 minutes", what does that mean? In this episode David Rein, METR researcher and co-author of the paper "Measuring AI ability to complete long tasks", talks about METR's work on measuring time horizons, the methodology behind those numbers, and what work remains to be done in this domain. Patreon: https://www.patreon.com/axrpodcast Ko-fi: https://ko-fi.com/axrpodcast Transcript: https://axrp.net/episode/2026/01/03/episode-47-david-rein-metr-time-horizons.html Topics we discuss, and timestamps: 0:00:32 Measuring AI Ability to Complete Long Tasks 0:10:54 The meaning of "task length" 0:19:27 Examples of intermediate and hard tasks 0:25:12 Why the software engineering focus 0:32:17 Why task length as difficulty measure 0:46:32 Is AI progress going superexponential? 0:50:58 Is AI progress due to increased cost to run models? 0:54:45 Why METR measures model capabilities 1:04:10 How time horizons relate to recursive self-improvement 1:12:58 Cost of estimating time horizons 1:16:23 Task realism vs mimicking important task features 1:19:50 Excursus on "Inventing Temperature" 1:25:46 Return to task realism discussion 1:33:53 Open questions on time horizons Links for METR: Main website: https://metr.org/ X/Twitter account: https://x.com/METR_Evals/ Research we discuss: Measuring AI Ability to Complete Long Tasks: https://arxiv.org/abs/2503.14499 RE-Bench: Evaluating frontier AI R&D capabilities of language model agents against human experts: https://arxiv.org/abs/2411.15114 HCAST: Human-Calibrated Autonomy Software Tasks: https://arxiv.org/abs/2503.17354 Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity: https://arxiv.org/abs/2507.09089 Anthropic Economic Index: Tracking AI's role in the US and global economy: https://www.anthropic.com/research/anthropic-economic-index-september-2025-report Bridging RL Theory and Practice with the Effective Horizon (i.e. the Cassidy Laidlaw paper): https://arxiv.org/abs/2304.09853 How Does Time Horizon Vary Across Domains?: https://metr.org/blog/2025-07-14-how-does-time-horizon-vary-across-domains/ Inventing Temperature: https://global.oup.com/academic/product/inventing-temperature-9780195337389 Is there a Half-Life for the Success Rates of AI Agents? (by Toby Ord): https://www.tobyord.com/writing/half-life Lawrence Chan's response to the above: https://nitter.net/justanotherlaw/status/1920254586771710009 AI Task Length Horizons in Offensive Cybersecurity: https://sean-peters-au.github.io/2025/07/02/ai-task-length-horizons-in-offensive-cybersecurity.html Episode art by Hamish Doodles: hamishdoodles.com
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
AI Unraveled: Latest AI News & Trends, Master GPT, Gemini, Generative AI, LLMs, Prompting, GPT Store
Welcome to AI Unraveled (December 30th, 2025): Your strategic briefing on the business, technology, and policy reshaping artificial intelligence.Hardware & Industry ConsolidationNvidia's $20B Dominance Play: In a massive move to secure its inference future, Nvidia has agreed to acquire key assets and employees from AI chip startup Groq for $20 billion. The deal is structured as an asset purchase and non-exclusive licensing agreement—likely to navigate antitrust scrutiny—allowing Nvidia to integrate Groq's ultra-fast LPU (Language Processing Unit) technology into its "AI Factory" roadmap.Cursor Acquires Graphite:Model Breakthroughs & BenchmarksChina's Z.ai Takes the Crown: Z.ai's new GLM-4.7 model has topped open-source benchmarks, reportedly outperforming GPT-5.1 High in coding tasks and introducing "Preserved Thinking" to prevent context decay in long agentic workflows.Claude Opus 4.5's Stamina: A new analysis by evaluation firm METR reveals that Anthropic's Claude Opus 4.5 can successfully execute tasks that require nearly 5 hours of human work,Poetiq Crushes Reasoning Benchmarks:Policy, Risk & GeopoliticsChina's "Ideological Test": New regulations in China require AI chatbots to pass a rigorous 2,000-question ideological exam,Pentagon Partners with xAI: The Department of Defense will embed Grok-based AI systems directly into its GenAI.mil platform by early 2026,Italy vs. Meta:Society & The WorkforceThe "Slop" Epidemic: A new study finds that over 20% of videos recommended to new YouTube users are now "AI slop"—low-quality, generative content designed solely to farm views.OpenAI's "Head of Preparedness": Sam Altman is hiring a lead to secure "systems that can self-improve,"Sal Khan's 1% Solution: Khan Academy founder Sal Khan is proposing that companies donate 1% of profits to retrain workers displaced by the looming AI job apocalypse.Keywords: Nvidia, Groq, GLM-4.7, Z.ai, Claude Opus 4.5, AI Slop, GenAI.mil, Pentagon, xAI, Grok, ARC-AGI-2, Graphite, Sal Khan, AI Regulation, Antitrust.Host Connection & Engagement:Etienne on Linkedin: https://www.linkedin.com/in/enoumen
As AI adoption accelerates across the software industry, engineering leaders are increasingly focused on a harder question: how to understand whether these tools are actually improving developer experience and organizational outcomes.In this year-end episode of the Engineering Enablement podcast, host Laura Tacho is joined by Brian Houck from Microsoft, Collin Green and Ciera Jaspan from Google, and Eirini Kalliamvakou from GitHub to examine what 2025 research reveals about AI impact in engineering teams. The panel discusses why measuring AI's effectiveness is inherently complex, why familiar metrics like lines of code continue to resurface despite their limitations, and how multidimensional frameworks such as SPACE and DORA provide a more accurate view of developer productivity.The conversation also looks ahead to 2026, exploring how AI is beginning to reshape the role of the developer, how junior engineers' skill sets may evolve, where agentic workflows are emerging, and why some widely shared AI studies were misunderstood. Together, the panel offers a grounded perspective on moving beyond hype toward more thoughtful, evidence-based AI adoption.Where to find Brian Houck:• LinkedIn: https://www.linkedin.com/in/brianhouck/ • Website: https://www.microsoft.com/en-us/research/people/bhouck/ Where to find Collin Green: • LinkedIn: https://www.linkedin.com/in/collin-green-97720378 • Website: https://research.google/people/107023Where to find Ciera Jaspan: • LinkedIn: https://www.linkedin.com/in/ciera • Website: https://research.google/people/cierajaspan/Where to find Eirini Kalliamvakou: • LinkedIn: https://www.linkedin.com/in/eirini-kalliamvakou-1016865/• X: https://x.com/irina_kAl • Website: https://www.microsoft.com/en-us/research/people/eikalliWhere to find Laura Tacho: • LinkedIn: https://www.linkedin.com/in/lauratacho/• X: https://x.com/rhein_wein• Website: https://lauratacho.com/• Laura's course (Measuring Engineering Performance and AI Impact) https://lauratacho.com/developer-productivity-metrics-courseIn this episode, we cover:(00:00) Intro(02:35) Introducing the panel and the focus of the discussion(04:43) Why measuring AI's impact is such a hard problem(05:30) How Microsoft approaches AI impact measurement(06:40) How Google thinks about measuring AI impact(07:28) GitHub's perspective on measurement and insights from the DORA report(10:35) Why lines of code is a misleading metric(14:27) The limitations of measuring the percentage of code generated by AI(18:24) GitHub's research on how AI is shaping the identity of the developer(21:39) How AI may change junior engineers' skill sets(24:42) Google's research on using AI and creativity (26:24) High-leverage AI use cases that improve developer experience(32:38) Open research questions for AI and developer productivity in 2026(35:33) How leading organizations approach change and agentic workflows(38:02) Why the METR paper resonated and how it was misunderstoodReferenced:• Measuring AI code assistants and agents• Kiro• Claude Code - AI coding agent for terminal & IDE• SPACE framework: a quick primer• DORA | State of AI-assisted Software Development 2025• Martin Fowler - by Gergely Orosz - The Pragmatic Engineer• Seamful AI for Creative Software Engineering: Use in Software Development Workflows | IEEE Journals & Magazine | IEEE Xplore• AI Where It Matters: Where, Why, and How Developers Want AI Support in Daily Work - Microsoft Research• Unpacking METR's findings: Does AI slow developers down?• DX Annual 2026
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
Jimmy Lai, declarado culpable de sedición por un tribunal de Hong Kong Supermercados públicos, ¿la mejor manera de abaratar la cesta de la compra? Sanción millonaria a Airbnb por incumplir la normativa de consumo El edificio Metrópolis, ¿un club privado para "mecenas del arte de vivir"?
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
La historia de las últimas horas y la información del momento. Análisis, comentarios y entrevistas bajo la conducción de Mercedes Altamirano.
Información oportuna y entrevistas de interés con Gricelda Torres Zambrano y Víctor Montes Rentería.
Confira os destaques de Os Pingos nos Is desta quarta-feira (17):O Plenário do Senado analisa nesta quarta-feira (17) o Projeto de Lei da Dosimetria, que prevê a redução de penas para os envolvidos nos atos de 8 de Janeiro. Mais cedo, a Comissão de Constituição e Justiça aprovou o texto, restringindo seus efeitos apenas aos réus desses episódios. A expectativa é de que a matéria seja votada ainda hoje.Após a aprovação na CCJ, o Senado avança na análise do PL da Dosimetria, que trata das regras de progressão de regime para os condenados pelos atos de 8 de Janeiro. Lideranças indicam a existência de um acordo para levar o texto ao plenário. O governo já sinalizou que o presidente Lula pode vetar a proposta caso ela seja aprovada pelo Congresso.A Assembleia Legislativa de Santa Catarina aprovou um projeto de lei que pode extinguir as cotas raciais nas universidades do estado. Integrantes do governo federal criticaram a proposta e classificaram a medida como um retrocesso nas políticas de combate à desigualdade. O texto segue agora para análise do governador Jorginho Mello, que pode sancionar ou vetar a lei.A pré-candidatura do senador Flávio Bolsonaro à Presidência da República expôs um racha no campo conservador e provocou reações entre aliados do ex-presidente Jair Bolsonaro. Em entrevista ao portal Metrópoles, o pastor Silas Malafaia avaliou que o movimento pode favorecer Lula ao dividir a oposição e afirmou que Flávio não teria musculatura política suficiente para enfrentar o atual mandatário em 2026.Silas Malafaia também criticou a ida do deputado Eduardo Bolsonaro aos Estados Unidos, afirmando que a decisão foi tomada por vontade própria. Segundo o pastor, Jair Bolsonaro era contrário à viagem e teria demonstrado emoção diante da escolha do filho, em meio às divergências internas no campo conservador.Você confere essas e outras notícias em Os Pingos nos Is.