ExplAInable

Follow ExplAInable
Share on
Copy link to clipboard

אורי גורן ותמיר נווה מדברים על Machine Learning ואתגרים בתעשייה עם מומחים מהתחום.

Tamir Nave & Uri Goren


    • May 27, 2025 LATEST EPISODE
    • every other week NEW EPISODES
    • 30m AVG DURATION
    • 120 EPISODES


    Search for episodes from ExplAInable with a specific topic:

    Latest episodes from ExplAInable

    איך מודלי שפה עובדים טוב גם לא באנגלית - עם גיא רוטמן, גונג

    Play Episode Listen Later May 27, 2025 49:27


    היום בעידן מודלי השפה הגדולים כשתרגום סימולטני מתאפשר בלייב, זה נראה כאילו מאז ומתמיד ChatGPT ידע לדבר עברית. עד לא מזמן היתה צניחה משמעותית בביצועים של מודלי שפה על שפות שאינן אנגלית. בפרק זה גיא רוטמן, חוקר אקדמי בתחום ובתעשייה ב gong.io ידבר איתנו על אתגרי העבר והווה באימון מודלי שפה רב שפתיים. נדבר על טיפים עכשוויים להתמודדות עם שפות כגון עברית, ועל אתגרי הדאטא.

    איך הגעתי למליוני חשיפות בלינקדין עם AI - עם מיכאל קיסילנקו

    Play Episode Listen Later May 19, 2025 41:23


    יוצא לנו הרבה לדבר על אייג׳נטים, על מודלי שפה, ועל איך הם עובדים. בפרק זה אנחנו נדבר עם מיכאל קיסילנקו - היזם מאחורי GenDesk, שמגיע שיטתית למליוני חשיפות בלינקדין בעזרת שימוש בAI. מיכאל פיתח מומחיות רבה, ולמד את האלגוריתם של לינקדין מכל הצדדים. פרק מלא תובנות שאסור לפספס

    מענה על שאלות חזותיות VQA - עם פרופ עידן שוורץ

    Play Episode Listen Later May 12, 2025 62:10


    היום כשמודלי שפה נהיו כ״כ חזקים, אנחנו לוקחים כמובן מאליו את יכולות הבנת התמונה. בפרק זה פרופ. עידן שוורץ מאוניברסיטת בר אילן יספר לנו על ההיסטוריה של התפתחות התחום, על ביאסים בתשובות ואיך מתמודדים איתם ומה הם האתגרים העכשוויים בתחום. ריבוי מודאליות גורם גם לבעיות מסדר שני, כגון ישור הקלטים, מציאת מרחב משותף מייצג, וכמובן מה עושים כאשר יש קונפליקט בין המימד החזותי לטקסטואלי למשל. ב28 למאי ייערץ יום עיון בבר אילן, שם עידן ומיטב המוחות בתחום יציגו את העבודות שלהם. קישורים לעיון: https://biu365-my.sharepoint.com/:f:/g/personal/schwari9_biu_ac_il/Eus14HAcXQBBuS_GhknGbh4Bevs1VixlLgPO0yCgLReY2w?e=GZJDnO

    חיפוש והמלצה 2025 - חוזרים אחורה - סיכום כנס הייסטאק

    Play Episode Listen Later May 4, 2025 34:48


    אחרי שנתיים ביקרנו שוב בכנס Haystack העוסק בחיפוש והמלצה. נדבר על ההבדלים בין 2025 לשנת 2023 ועל מגמת החזרה לעולם החיפוש הלקסיקוגרפי על חשבון החיפוש הוקטורי. ועל גישות LLM as a judge הרווחת לאיבליואציה של חיפוש והמלצה

    מתקפות סייבר על מודלי שפה - עם נתן כץ

    Play Episode Listen Later Apr 29, 2025 30:46


    מודלי שפה גדולים אמנם עוזרים לפרודקטיביות, אבל גם של ההאקרים. עולם הסייבר השתנה רבות מאז יציאת ChatGPT - מומחים מעריכים שמספר הפריצות גדל פי ארבעה. בפרק זה נתן כץ יסקור לנו ארבע שיטות לניצול חולשות במודל השפה עצמו. נדבר על גניבת מודלים, ״הרעלה״ של סט האימון והרעשה של המודל לביאס עבור מילת אקטיבציה ספציפיתץ נתן יחלוק לנו מתובנותיו בlumin AI על תהליך המכירה לCSO בארגון, ונדבר על ההבדלים בין סיכוני open source ל״משקולות פתוחים״ לקריאה נוספת: https://owasp.org/www-project-machine-learning-security-top-10/ https://owasp.org/www-project-top-10-for-large-language-model-applications/assets/PDF/OWASP-Top-10-for-LLMs-2023-v05.pdf

    על RLHF ומודלי שפה גדולים

    Play Episode Listen Later Apr 19, 2025 55:10


    בפרק זה החליפו מייק ותמיר את התובנות החידודים והשאלות הפתוחות שלהם בניסיון להבין איך מתחברים עולם ה RL ועולם ה LLM (קרי RLHF). ב 2024 השתנתה הפרדיגמה - בתחילה יצירת מודל reward כדי לעשות אימון נוסף ל LLM אחרי ה pretraining שלו באמצעות PPO. ולאחר מכן הוחלף ה PPO בRLHF. בעוד רוב מודלי ה reasoning של החברות הגדולות (chatgpt, claude, gemini) עדיין באפילה - נדבר על איך לדעתנו RLHF יכול לשמש בתהליך.

    קבלת החלטות ארוכות טווח עם פרופ. גיא שני

    Play Episode Listen Later Apr 10, 2025 32:59


    יאן לקון, מאבות הAI המודרני מאמין שהעתיד נמצא בתיכנון טווח ארוך (planning) ולא בחיזוי המילה הבאה. פרופסור גיא שני מהפקולטה להנדסת מערכות מידע באוניברסיטת בן גוריון ומוביל קבוצת מחקר בeBay יספר לנו על האתגרים. נדבר על סוגים של אי וודאות במודלים, ושיטות תכנון לאופק מוגדר לעומת אופק לא ידוע. נצלול לעומק הגישות המרקוביות הקלאסיות, כמו POMDP ונשווה מול גישות Reinforcement learning. למי שמעוניין לצלול לפרטים, פרופסור גיא שני והמעבדה שלו הקליטו קורס אונליין חינמי בקישור הבא:  https://campus.gov.il/course/bgu-acd-bgu-ai101/

    NVIDIA GTC 2025 - סיכום הכנס

    Play Episode Listen Later Mar 30, 2025 28:26


    כנס הGTC של אנבידיה הוא אחד האירועים המרכזיים של עולם הAI. הכנס נערך חמישה ימים והסתיים ב22 למרץ 2025, בפרק זה ננסה לתמצת לכם את עיקרי הדברים בעשרים דקות. וכהרגלנו, נבחון בעין ביקורתית את ההצהרות וההכרזות שהיו בכנס. מה נאמר על רובוטים, דיפסיק, עתיד המניה ומה לא נאמר ובלט בהיעדרו.

    בעקבות המאמר של מטא עם לירון יצחקי אלרהנד

    Play Episode Listen Later Mar 19, 2025 44:16


    מעטים המאמרים המתארים בפירוט רב כל כך את האתגרים של יצירת וידאו מטקסט. במאמר הMovieGen של מטא, נכתבו 92 עמודים של המודלים השונים שנדרשים כדי לייצר סרטונים קצרים. בפרק זה לירון יספר לנו על האתגרים הטכניים כמו מגבלת הזכרון, וסוגי הטעויות שניתן להבחין בסרטונים מג׳ונרטים. אנחנו נסקור בקצרה את הגישות שמטא לקחו במאמר שלהם, ונפרק את השיטה לתתי המודלים שמרכיבים את הpipeline הארוך של יצירת סרטונים עם AI.

    מדידת GenAI עם אסף בורד

    Play Episode Listen Later Mar 13, 2025 50:12


    להכניס מודלי שפה כמו ChatGPT למערכת, זה יחסית קל ונגיש, עם אלפי דוגמאות ותמחור תחרותי אצל הספקים השונים. אבל למדוד את הביצועים של מודל כזה או אחר נשארת בעיה פתוחה, במיוחד אם משלבים גם מדדים עסקיים. בפרק זה נארח את אסף בורד, שמוביל את מאמצי ה GenAI בחברת Northwestern Mutual והשיק לאחרונה את Multinear.com כקוד פתוח לאבלאוציה. נדבר על חמשת הרכיבים שיש לבדוק כשמנסים להעריך מערכת AI בשלמותה: דאטא, פונקציית המטרה, הפרומפט, הסטאק הטכנולוגי ובדיקות. ונעמיק בהשוואה מול ספריות אחרות וטכניקות מדידה כגון GPT as a judge

    האתגרים בבינה מלאכותית בעולם הפיזי, עם אופיר זמיר מ NVIDIA

    Play Episode Listen Later Mar 1, 2025 30:02


    נראה שהבינה המלאכותית כבר כאן, חיה ובועטת - אבל עדיין אין רובוטים מתהלכים ביננו. בעוד מודלי שפה גדולים מגיעים לתוצאות מבחני לשכה מעל העורך דין הממוצע, הם עדיין מתקשים בקיפול גרביים. בפרק זה נארח את אופיר זמיר מNVIDIA שייספר לנו על האתגרים, ועל טכניקות כגון Imitation learning, Simulation ועל הכלים שאנבידיה מביאה לשולחן מבחינת חומרה ותוכנה כדי להפוך את החלום על רובוטים למציאות.   זו הזדמנות מעולה להזכיר שכנס הGTC השנתי של אנבידיה קורה החודש, ב17 למרץ ואפשר להשתתף אונליין ללא עלות. להרשמה https://www.nvidia.com/gtc/?ncid=ref-inpa-481629

    הלוסינציות עם ישי רוזנברג

    Play Episode Listen Later Feb 23, 2025 45:25


    כולנו מכירים את התופעה שמודלי שפה גדולים נוטים להמציא דברים שלא היו ולא נבראו. אבל האם אפשר לכמת את איכות המודל לפי רמת ה״הזיות״ שלו? ומה לגבי סוכנים? שם טעות בשלב אחד יכולה להשפיע דרמטית על הכלים שייבחרו בשלבים הבאים? אירחנו את ישי רוזנברג, חוקר בתחום שמוביל את Verax AI לדבר על איך אפשר להתמודד עם בעיות האמינות של מודלים. ומדוע לדעתו צריך להיות דקדקנים במינוח של סוגי הטעויות לפי הקונטקסט הנכון.

    בינה מלאכותית בגובה העיניים עם בר שאלתיאל

    Play Episode Listen Later Feb 16, 2025 36:19


    בר שאלתיאל מוביל את קהילת בינה מלאכותית בגובה העיניים המונה מעל 30000 אנשים. בר שיצא בשאלה מהעולם החרדי לפני כשלוש שנים גילה כמעט בטעות את כוחם של מודלי השפה הגדולים כשהתחיל לסייע לסטודנטים לכתוב עבודות אקדמיות. מאז נכנס בר למסע של מחקר והבנה איך המנגנון עובד, ואילו פרומפטים יעילים ביותר. יוצא לנו הרבה לדבר על מודלי שפה גדולים מנקודת המבט של החוקר, ובפרק זה נצלול לראשונה לחוויית המשתמש והbest practices שבר מלמד מהעבודה בשטח.

    בואו לפגוש אותנו בפרק לייב ראשון - Ask us anything

    Play Episode Listen Later Feb 12, 2025 0:50


    כבר חמש שנים שאנחנו מקליטים על למידת מכונה, אלגוריתמים ולא מעט על GenAI. עוד אף פעם לא מאוחר להזמין לפרק לייב, בשיתוף פעולה עם qodo לפרק מיוחד של Ask me anything/ כדי שנוכל להתכונן, נשמח לענות על השאלות שלכם בקישור הבא: https://docs.google.com/forms/d/e/1FAIpQLSeqQX4VtEoGxa4IlEi4-cpn46mtkhOdogR4FTxNwuq8cXy2HA/

    DeepSeek - הצצה פנימה - איך הוא עובד

    Play Episode Listen Later Feb 1, 2025 43:34


    כולם מדברים על דיפסיק, המודל הסיני, החדש, הזול והאופן סורס שמביס את צ׳אט ג׳י פי טי ומביך את OpenAI בפרק זה נדבר על ארבעת החידושים הטכנולוגיים מהמאמר: GRPO, KL-divergence approximation, multi token prediction והקוואנטיזציה. ואיך לא, גם קצת השערות של מייק ארליכסון ושל אורי גורן על מה באמת קורה מתחת למכסה המנוע.

    דאטה טאבולרי במחקר עם פרופ׳ אופיר לינדנבאום

    Play Episode Listen Later Jan 27, 2025 25:19


    בפרק זה מצטרף אלינו פרופ' אופיר לינדנבאום מאוניברסיטת בר-אילן לשיחה על השימוש בלמידת עומק לגילוי מדעי. נדון באתגרים הייחודיים של נתונים טבלאיים, היתרונות של רשתות נוירונים מול שיטות מסורתיות, ויישומים מעשיים בתחומים כמו ביולוגיה ורפואה. המאמר שהזכרנו בפרק האתר של אופיר לינקדאין של אופיר

    בין תחרות למציאות: הצצה לתחרויות Kaggle עם דן עופר

    Play Episode Listen Later Jan 20, 2025 39:46


    בפרק זה, אירחנו את דן עופר, מדען נתונים בכיר ב-Medtronic ודוקטורנט באוניברסיטה העברית, נדבר על ניסיונו בתחרויות Kaggle ובתחום מדעי הנתונים. נדון גם בתרומתה של Kaggle לפיתוח יכולות מעשיות, באתגרים שבין התחרויות לבין המציאות המקצועית, ובתובנות שנרכשו מתחרות ProteinBERT לאנליזת חלבונים באמצעות מודלים מבוססי שפה. גיטהאב של דן לינקדאין של דן  

    מושג בקצרה עם מייק: Peft

    Play Episode Listen Later Jan 16, 2025 7:35


    פרק שני בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה. 

    חיזוי קונפורמי: מבט מעמיק עם חילף חסון

    Play Episode Listen Later Jan 13, 2025 25:33


    בעקבות הפרק שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי החלטנו  הפעם לצלול עמוק פנימה. בפרק הזה, אנחנו צוללים לעומק עולם הניבוי הקונפורמי. יחד עם חילף חסון, נדון כיצד ניתן ליישם ניבוי קונפורמי בבעיות קלאסיפיקציה, מה היתרונות, ואיך זה לסייע בקבלת החלטות מדויקות יותר בעולם הנתונים. פרק עשיר בתובנות לכל חובבי ה-AI והדאטה סיינס   האתר של חילף Conformalized Quantile Regression Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

    פרומפטים חכמים: מהפכת DSPy עם סרג' סמורדינסקי

    Play Episode Listen Later Jan 6, 2025 25:36


    היום בפרק נדבר עם סרג' סמורדינסקי, ראש תחום NLP ומחקר ב-Loris AI, לשיחה על חלופות להנדסת פרומפטים וכלי DSPy. סרג' ישתף על האתגרים בעבודה עם מודלים לשוניים גדולים (LLMs) וכיצד DSPy מאפשר יצירת פרומפטים דינמיים ואופטימליים. נציע מבט חדשני על עתיד ה-NLP ושיטות עבודה מתקדמות בתעשייה.   לינקדאין של סרג׳ DSPy: Machine Learning Attitude Towards LLM Prompting מאמרים של סרג׳ במדיום

    סיכום שנה - שנת 2025, השנה בה אייג׳נטים הולכים למות

    Play Episode Listen Later Jan 1, 2025 25:59


    ברוכים הבאים לפרק סיכום שנת 2024! הפעם שוחחנו עם איתן צימרמן, מוביל צוות הדאטא סייאנס ב-ARGMAX, סיכמנו את שנת 2024 ועל המגמות, האתגרים וטרנדים שנתקלנו בהם לאורך השנה בנוסף, שיתפנו את התחזיות שלנו לשנת 2025 – אילו טרנדים חדשים צפויים לצבור תאוצה? אילו בעיות טכנולוגיות נצטרך לפתור? מה אתם צופים ששנת 2025 תביא איתה בעולמות הML?   לינקדאין של איתן

    בין אקדמיה לתעשייה: עם אבי קצ׳ולרו ואמיר דוד ניסן כהן NLP

    Play Episode Listen Later Dec 30, 2024 47:48


    היום בפרק נצלול לעומק עולמות האקדמיה בתחום הNLP  אבי ואמיר, חוקרים ומומחים בעולמות ה-NLP, משתפים במסלולי הקריירה שלהם, ההבדלים בין מחקר באקדמיה לעבודה בתעשייה, וכיצד ניתן למנף דוקטורט לקריירה מצליחה. נדון גם בשאלה מה הופך מחקר אקדמי למעניין, אילו כישורים ניתן לפתח בתהליך הדוקטורט, ומהם ההבדלים בין מחקר לתעשייה בעידן של LLMs האתר של אבי לינקדאין של אמיר

    פיזיקה, סדרות זמן, ולמידת מכונה: עם הדר שרביט

    Play Episode Listen Later Dec 23, 2024 33:02


    בפרק הבא נחקור יחד עם הדר שרביט את השילוב בין פיזיקה ללמידת מכונה בחיזוי סדרות זמן. נדון בהבדלים בין חיזוי לניבוי בזמן אמת, באתגרים תעשייתיים, ובדרכים שבהן מודלים פיזיקליים ונתוני חיישנים משתלבים כדי ליצור פתרונות מתקדמים.   לינקדאין של הדר Nixtla הבלוג של הדר

    יצירת וידיאו מטקסט: האתגרים והמורכבויות עם לירון יצחקי אלרהנד

    Play Episode Listen Later Dec 16, 2024 37:23


    בפרק זה נדבר עם לירון יצחקי אלרהנד באתגרים הטכניים ביצירת וידאו באמצעות בינה מלאכותית. נדון בניהול זיכרון, שמירה על קוהרנטיות בין פריימים, והקשרים בין מודלי שפה ליצירת וידאו, ונציג גם פתרונות חדשניים להתמודדות עם תנועות מורכבות ושיפור עקביות ויזואלית

    מושג בקצרה עם מייק: Training LLMs

    Play Episode Listen Later Dec 12, 2024 13:51


    פרק שני בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה. 

    אימון מודלים בבינה מלאכותית עם בן בורן

    Play Episode Listen Later Dec 9, 2024 30:12


    בפרק זה נשוחח עם בן בורן, CTO של SwarmOne, על האתגרים בהכשרת מודלים בבינה מלאכותית. בן יסביר על עבודה עם GPU, שמירה על אבטחת מידע, וסקלת מודלים גדולים. הם ונדון גם בהשפעת LLM ובדרכים לייעל את תהליכי ההכשרה. SwarmOne הלינקדאין של בן

    ראג, לאן מכאן? פרק משותף עם ״המחוללים״

    Play Episode Listen Later Dec 2, 2024 35:29


     פרק משותף עם הפודקאסט ״״המחוללים של דורון שדה ושקד זיכלינסקי והפעם, נדון בכל מה שקשור ל-RAG, והאם אכן מכאן תגיע הישועה לפתרון בעיית ההזיות של מודלי שפה?   ״המחוללים״ האתר של דורון לינקדאין של שקד

    סוכנים אוטונומיים עם עמית מנדלבאום

    Play Episode Listen Later Nov 25, 2024 49:43


    בפרק הבא נדבר עם עמית מנדלבאום על התפתחות סוכנים אוטונומיים תוך שימוש במודלים מתקדמים של ראיית מחשב ו-LLMs. נתייחס לאתגרים בשילוב יכולות היסק ושיקול דעת, ולבעיות שהיו בפרויקטים כמו AutoGPT. נציג את הצלחתה של חברת Anthropic בהבנה של פעולות ממסכי מחשב ונסביר כיצד טכנולוגיות אלו משפרות את ההתמודדות עם פעולות ממוחשבות בצורה קרובה להתנהגות אנושית.   https://medium.com/@luke.birdeau/reverse-engineering-chatgpt-o1-5cf3b61c6eee AI Agents That Matter https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities

    מושג בקצרה עם מייק: Encoder/Decoder

    Play Episode Listen Later Nov 24, 2024 17:08


    פרק ראשון בסדרת ״מושג בקצרה עם מייק״ בה נצלול לעומקם של מושגים מעולמות הML וAI. בכל פרק נתמקד במושג אחד מרכזי – נסביר אותו בפשטות, נדון במשמעויותיו המעשיות, ונבחן את השפעתו על התחום והתעשייה. 

    כתיבה גנרטיבית מול אנושית: ניווט באזור האפור עם אביב קרן

    Play Episode Listen Later Nov 18, 2024 46:59


    בפרק הבא נדבר על העולם המורכב של זיהוי טקסט שנוצר על ידי בינה מלאכותית. נסקור את השימושים הנפוצים ב-ChatGPT, מהכתיבה ועד ליישומים אפורים כמו העתקות ובוטים. יחד עם אביב קרן, נדון בשיטות לזיהוי טקסט מג׳ונרט, השפעות על האקדמיה, שימושים בבינה מלאכותית לאימון מודלים, ונדבר גם על האתגרים האתיים והטכנולוגיים שמלווים את התחום. Semantic Scholar A Survey on LLM-generated Text Detection: Necessity, Methods, and Future Directions  

    למידה ניגודית עם אורי ומייק

    Play Episode Listen Later Nov 11, 2024 34:10


    היום בפרק נעסוק בהבנת למידה ניגודית ובחקר ההתפתחות שלה בשנים האחרונות. נדבר על עקרונות הבסיסיים של למידת קונטרסט, כמו חיפוש דימויים דומים (חיוביים) ודימויים שונים (שליליים), על כך שלפעמים קשה להגדיר את הדימויים השונים בצורה חד משמעית, והצורך בהגדלת כמויות הדאטה כדי להשיג תוצאות טובות יותר. נזכיר את השיטות השונות שהתפתחו, כגון SimCLR ו-Moco, ונסביר את החשיבות של טרנספורמציות והתאמות בתמונות כדי ללמוד את הקשרים האמיתיים בין הדימויים. נתאר גם שיטות מתקדמות יותר כמו "למידת קונטרסט אקוויבריאנטית" ו-"Diff-CSE" שמתמודדות עם אתגרים של אוגמנטציה (הגברת מידע) בתמונות ובטקסטים.   הפרק הקודם עם מייק שהזכרנו פרק קודם על למידה ניגודית

    בינה מלאכותית ללא קוד עם גל פרץ

    Play Episode Listen Later Nov 4, 2024 29:06


    היום בפרק נדבר עם גל פרץ, מהפודקאסט "LangTalks" ומומחה בתחום הבינה המלאכותית. נשוחח על נושאים כמו התפתחות השימוש במודלים של בינה מלאכותית, תפקידם של כלי No-Code בעולם הטכנולוגי, ואיך בינה מלאכותית משפיעה על הגישה ההנדסית והמחקרית של פיתוח מערכות היום. נבחנן גם את האתגרים וההזדמנויות שהתחום מציב עבור אנשי מוצר, מהנדסים וחוקרים, ועל חשיבותם של כלי Prompt Engineering ככלי שימושי בעבודה עם מודלים מתקדמים.   GPT Canvas GitHub Copilot Cursor Langflow Voiceflow לינקדאין של גל LangTalks Podcastֿֿ

    Policy Diffusion: המהפיכה הבאה? עם מייק ותמיר

    Play Episode Listen Later Oct 28, 2024 48:27


    בפרק זה דיברנו  על מאמר פורץ דרך בתחום הרובוטיקה: Diffusion Policy: Visuomotor Policy Learning via Action Diffusion המאמר טוען לשיפור של 46.9% במשימות מוטוריות של רובוטים. הם מראים תוצאות על סימולציות ועל רובוטים פיסיים. פעולות כמו מזיגה, עירבוב, הנחת ספל והסביבה המפורסמת push-T. בגדול הם לקחו את מה שכבר סקרנו בעבר stable diffusion לעולם הרובוטיקה, כאשר כאן נכנסת סדרת תמונות (המתקבלות ממצלמת הרובוט) ויש להחזיר סדרת פעולות מוטוריות לרובוט. וגם כאן יש איטרציות של denoising אבל לא מתמונות אלא מסדרת פעולות מוטוריות. האם זו המהפיכה הבאה ? מוזמנים להגיב בדעתכם…   קישורים: https://arxiv.org/pdf/2303.04137v5 https://diffusion-policy.cs.columbia.edu/ https://mobile-aloha.github.io/ https://wuphilipp.github.io/gello_site/ https://umi-gripper.github.io/ https://dobb-e.com/ הפרק שמייק התארח בו הבלוג של יאנג סונג

    שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי

    Play Episode Listen Later Oct 20, 2024 30:14


    אחרת הטכניקות הקלאסיות (משנות ה80) שזוכה לאחרונה לפופולאריות מחודשת היא Conformal Prediction. ברוב משימות הניבוי, לא מספיק לחזות רק מה התוצאה הכי סבירה - אלא מה הן מגוון האפשרויות, ומה הסבירות. ניקח למשל רופא שצריך לאבחן מטופל על סמך הסימפטומים, תוצאת הדיאגנוזה שלו תגרור את הטיפול המתאים. לכל אבחנה מתוך סט האבחנות יש סיכוי, וייתכן שיידרשו בדיקות נוספות כדי לאסוף עוד נתונים. ניבוי קונפורמי מנסה לקשור בין רמת הביטחון החזויה, לגודל הקבוצה החזויה. אורי יסביר כיצד שיטה זו מספקת מסגרת מתמטית שמאפשרת לבצע ניבויים מדויקים יותר עבור מודלים של למידת מכונה, תוך התאמת רמת הוודאות של הניבוי בהתאם לקושי המשימה. נספר על שלושת שלבי הניבוי, שמתאימים לכל מודל קלאסיפיקציה, ונדבר על ספרית MAPIE שהנגישה את המודל לקהילת הפייתון.

    GPT-4o1: האם אנחנו קרובים להבנה אמיתית?

    Play Episode Listen Later Oct 14, 2024 40:00


    בפרק הבא נדבר על הגרסה החדשה GPT-4o1, שמבטיחה יכולות מתקדמות של הסקת מסקנות. מייק יסביר כיצד המודל מנסה להתמודד עם בעיות מורכבות שדורשות יכולת לוגית מרובה, ומעלה את השאלה האם המודל באמת מצליח להתמודד עם משימות הסקה מורכבות או שמא הוא "מגזים" בהערכותיו. נבדוק גם את ההבדלים בין גרסאות קודמות, כמו GPT-3 ו-GPT-4, ונבחן את האתגרים וההזדמנויות שהגרסה החדשה מביאה.  נדבר על איך אנחנו כבני חושבים ולמה הגרסה החדשה אמנם בכיוון הנכון אבל עוד רחוקה מלחשוב כמונו.

    Mechanistic Interpretability עם מייק ארליכסון

    Play Episode Listen Later Oct 8, 2024 41:58


    בפרק הבא, נצלול לנושא המורכב של מכניסטית אינטרפרטביליות (Mechanistic Interpretability) במודלים של שפה, וננסה לפשט את הדרך בה ניתן להבין מה מתרחש בתוך מודלים אלה. נסביר כיצד מודלים בשימוש רחב כמו טרנספורמרים ומבנים מתמטיים אחרים מנסים לפענח את מנגנוני השפה, אבל נדבר גם על הקושי להבין מה באמת קורה "מאחורי הקלעים" של רשתות נוירונים עמוקות. נבין את השיטות השונות לפרש את פעולת המודל תוך התמקדות בניתוח המכניסטי של שכבות ותהליכים פנימיים.   הבלוג ששווה שתכירו

    להגדיר מחדש את החיפוש: חידושים ב - RAG עם ניר דיאנט

    Play Episode Listen Later Oct 1, 2024 33:11


    בפרק הבא, נארח את ניר דיאנט, יועץ בתחום הבינה המלאכותית הגנרטיבית (GenAI) שיספר לנו על המסע המקצועי שלו והתפתחויות חדשניות בתחום. ניר מצטרף אלינו בעקבות תרומתו המשמעותית לשיטות RAG (Retrieval-Augmented Generation) כולל פיתוחים כמו GenAI Agents ו-Controlable RAG, שזכו להכרה רחבה ואף פורסמו על ידי מנכ״ל LangChain, האריסון צ׳ייס, כתכנים הפופולריים ביותר שלהם. בפרק נדון בפתרונות לשיפור החיפושים והשליפות, סידור מתקדם של דאטא, התאמות מולטימודל, ו-RAG עם לולאות פידבק להתאמת המידע לסוגי שאילתות שונים.

    מדע הנתונים – איך הוא השתנה לאורך השנים עם דניאל אהרונוביץ'

    Play Episode Listen Later Sep 23, 2024 39:59


    בפרק הזה דניאל ארונוביץ', מדען נתונים ותיק, מספר על המסע האישי שלו בתעשיית הטכנולוגיה לאורך 15 שנים. ניגע בהבדלים הבולטים בין העבר להווה, בכלים שהשתמשו בעבר לעומת הכלים שמשתמשים בהם היום שמחברים את המדע ישר לפרודקשן. דניאל מתאר את השינויים במיומנויות הנדרשות ממדעני נתונים, מיכולת ניתוח בלבד להכרח להבין תהליכי פיתוח וניהול גרסאות. נשוחח על האתגרים הטכניים, השינויים בפרקטיקות העבודה, וכיצד התפתח התחום מימי האלגוריתמים הקלאסיים ועד לתפקידי הדאטה המודרניים בעולם התוכנה.     Dataflint/Spark לינקדאין של דניאל

    NotebookLLM - הפרק שלא אנחנו הקלטנו

    Play Episode Listen Later Sep 16, 2024 9:36


    החודש גוגל פרסמו את NotebookLLM, שירות AI שמייצר שיחת עומק מוקלטת בין שני דוברים לא אמיתיים. כדי לבדוק את העניין, העלנו תמלול של "רק לא RAG" פרק הטיפים של אורי גורן מארגמקס על נסיונו עם ארכיטקטורת הRAG. והתוצאה, הפילה אותנו מהרגליים. נשמח לשמוע מה דעתכם? האם אפשר למכור את המיקרופון והציוד הקלטה ביד2?

    Data Science בעולם הביטוח עם דוד שוקרון

    Play Episode Listen Later Sep 15, 2024 28:54


      בפרק הזה, דוד שוקרון, Head of DS & AI בביטוח ישיר, מספק הצצה לעולם מדעי הנתונים בתעשיית הביטוח. נשמע ממנו על ההבדלים בין אקטואריה ל-Data Science, ועל איך משלבים DS במערכות ותיקות של חברות ביטוח דוד יסביר על יישומי DS בתעשייה עתירת נתונים כמו ביטוח, בשימוש בכלים ומודלים שונים, כולל השאלה אם יש צורך בכלים ייחודיים או שניתן להסתפק במוצרי מדף קיימים. בנוסף, נבין איך מודלי שפה משפיעים על תעשיית הביטוח, ומה הכיוונים העתידיים שמעצבים את התחום בעקבות החידושים האחרונים.   .

    LLM לייעוץ השקעות עם אלעד נחמיאס

    Play Episode Listen Later Sep 1, 2024 28:50


    בפרק זה, אנחנו נשוחח עם אלעד נחמיאס CTO של Bridgewise, על השימוש במודלי שפה גדולים (LLMs) בתחום ההשקעות. אלעד יסביר לנו איך משלבים טכנולוגיות מתקדמות כדי לשפר  תהליכי הייעוץ והאנליזה, תוך התמודדות עם אתגרים כמו דיוק הנתונים, הטיות פוטנציאליות ושמירה על פרטיות המידע. נשמע על האתגרים הטכניים והאתיים של יישום LLMs, איך Bridgewise מוודאת שהפתרונות שלה נשארים שקופים ואחראיים, ומה החזון העתידי שלה לשימוש בטכנולוגיה זו בתעשיית ההשקעות.

    Adaptive-RAG עם לירון יצחקי אלרהנד

    Play Episode Listen Later Aug 25, 2024 30:35


    בפרק הזה, נצלול יחד עם לירון יצחקי אלרהנד ל Interleaving Retrieval with Chain of Thought (IRCoT)  שיטה לשיפור מערכות שאלה ותשובה על ידי הרחבה איטרטיבית של תהליך חשיבה ואחזור מידע רלוונטי. נדבר על טכניקות שונות של אחזור אדפטיבי, נשווה את יעילותן על סמך מורכבות השאלה, ונדגיש את החשיבות של בחירת הגישה הנכונה לתרחישים שונים   המלצות של לירון למי שמועניין ללמוד עוד: https://arxiv.org/abs/2212.10509 https://github.com/StonyBrookNLP/ircot/tree/main  https://colab.research.google.com/github/pathwaycom/pathway/blob/main/examples/notebooks/showcases/mistral_adaptive_rag_question_answering.ipynb https://arxiv.org/abs/2403.14403

    Task Aware Embedding עם ענבל חורב

    Play Episode Listen Later Aug 18, 2024 18:30


    לא רק היופי הוא בעיניי המתבונן, מסתבר שגם הדימיון הסמנטי בפרק הזה ענבל תספר לנו איך התגלגלה מטוקיו ל  בגונג senior staff researcher  כשחושבים על אמבדינגז, הרבה פעמים חושבים על חיפוש וקטורי ו RAG נדבר על החשיבות של אמבדינג טוב דווקא בשלב הכרת הדאטא ובחירת דוגמאות מעניינות לאימון. נסקור את ההיסטוריה של אמבדינג, ללא הקשר, עם הקשר, ועד Task aware embedding שהוא צעד ביניים למודל שפה מלא   לינקדאין של ענבל E5 MTEB  

    מלימודים הומניסטים למדעי הנתונים - פרק בשיתוף עם YData

    Play Episode Listen Later Aug 10, 2024 28:54


    בפרק זה ריאיינו את אורי גוטליב ונטע בר על המעבר שלהם לעולם ה data sciense במסגרת ההכשרה שלהם ב YData. על הפער העצום בין התאוריה לעבודה מעשית  ועל הפרויקט שעשו שהביא אותם לעבודה הנוכחית שלהם. קישורים: אורי גוטליב נטע בר wids il facebook Wids-linkdin קהילת באות

    בינה מלאכותית וצ'יפים - עם ד"ר אמיתי ערמון

    Play Episode Listen Later Aug 5, 2024 37:06


    אינטל העולמית נמצאת השבוע בכותרות בעקבות ההצהרה על הצמצומים, וזו הזדמנות מעולה להזכיר על הפעילות המדהימה של קבוצת הדאטא סיינס של אינטל ישראל. החודש פורסם כי הקבוצה AI Solutions Group זכתה בפרס הארגון המצטיין העולמי של אינטל. בפרק זה ד"ר אמיתי ערמון יספר לנו על התפקיד שלו בתור ה Chief Data Scientist של הקבוצה, מה היא עושה? מה האתגרים היחודיים שלהם? ואיך מתנהלת העבודה של 250 עובדים שבונים ביחד מוצרים מבוססי בינה מלאכותית? נדבר על פרוייקטים לדוגמא, על ללמים ועל המאמר שכתב Tabular Data: Deep Learning is Not All You Need שהגיע השבוע לאלף ציטוטים.   Tabular Data: Deep Learning is Not All You Need עמוד הלינקדאין של אמיתי

    על מודלים פתוחים, רשיונות ורגולציה עם עופר חרמוני

    Play Episode Listen Later Jul 28, 2024 30:17


    קוד פתוח זה נושא מורכב, יש כמה סוגים של רשיונות כמו GPL, Apache, MIT וכו׳. העניינים מסתבכים עוד יותר כשמדברים על מודלים פתוחים, האם קוד המודל פתוח? אולי רק המאמר? אולי רק המשקולות פתוחות? ומה לגבי הדאטא? בפרק זה עופר חרמוני, יועץ בתחום הAI וחבר ב Linux foundation יספר על הקריטריונים של הארגון למודלים פתוחים, ונמנה מספר מודלים כאלו. עולם הAI מתקדם בקצב מסחרר, והמחוקק לא תמיד מצליח לעקוב - בשיחה עם עופר דיברנו על המירוץ וההשלכות החוקיות על שימוש במודלים פתוחים, והתוצרים שלהם. LF AI & Data website: https://lfaidata.foundation/ AI Open Source landscape: https://landscape.lfai.foundation/ Generative AI Commons website: https://genaicommons.org/ Generative AI Commons - Get Involved guide: https://docs.google.com/presentation/d/1Ie0NKJ4N5u3UINUdiwoA7pBYtaRrUdH0gEcMUo9M9Y0/edit?pli=1#slide=id.g2c0160abebd_0_72 OSI - open source AI initiative - latest definition: https://opensource.org/deepdive/drafts/the-open-source-ai-definition-draft-v-0-0-8 OSI - Open Source AI initiative discussion forum: https://discuss.opensource.org/ Connect with me on LinkedIn: https://www.linkedin.com/in/ofer-hermoni/  

    על סימולציה בתעשייה עם גיא אדלר

    Play Episode Listen Later Jul 20, 2024 23:36


    גיא אדלר מחברת אקסיליון יחלוק איתנו מנסיונו בפיתוח ושימוש במערכות סימולציה לעולם התחבורה. אקסיליון מפתחת מוצר לעיריות לצורך אופטימיזציה של רמזורים ותנועה, כדי שכולנו נבלה כמה שפחות זמן בפקקים. נדבר על האתגרים בתחזית של אירועים נדירים כגון מזג אוויר, הופעות, ושיבושי תנועה. ועל החשיבות של עבודה משותפת עם מומחי תוכן ואינטגרציה עם מערכות אמיתיות של עיריות כבר בתהליך הסימולציה. סימולציה היא דבר יקר, וגיא חולק איתנו מאתגריו בפיתוח מערכות יעילות בc++ כדי שהמערכת תוכל לרוץ בזמנים סבירים.

    ניסויים מדעיים באמצעות סימולציות - עם רותם רוזנבלום

    Play Episode Listen Later Jul 13, 2024 33:50


    פרק פיצוץ על איך סימולציות יכולות לעזור לנו לחזות תגובה של חומרי נפץ במתחים שונים. בפרק זה רותם תספר לנו על המחקר האקדמי שלה בשיתוף עם רפאל, ועל איך סימולציות עזרו לחסוך המון כסף וזמן על ניסוי שטח. נדבר על ההבדלים בין סימולציות סדרתיות, ובין סימולציות אגרגטיביות. ומדוע סימולציות הם הכלי הנכון לבדוק את המודל שלנו בכל מיני מקרי קצה נדירים, או שטרם קרו.   קישור ללינקדין של רותם

    על ההיסטוריה של סימולציות עם יניב טננבאום קטן

    Play Episode Listen Later Jul 6, 2024 30:36


    סימולציות היו פעם כלי הניבוי המרכזי, והיום הוחלפו על ידי מודלי למידת מכונה. האם מדובר בכלי מיושן ולא רלוונטי, או באומנות עתיקה שנשכחה. בפרק זה נדבר על המוטיבציות לסימולציות אל מול הרצת ניסויים על דאטא אמיתי, ונדבר על החוזקות והחולשות מול מודלי למידת מכונה.   קורס חינמי של אוניברסיטת חיפה על סימולציות

    המלצות, סימולציות, שינוי העדפות ודילמות טווח ארוך - טווח קצר - עם פרופ׳ עומר בן פורת

    Play Episode Listen Later Jun 29, 2024 40:11


    מערכות המלצה נתפסות לרוב כבעיית רגרסיה או קלאסיפיקציה, בפרק זה פרופסור עומר בן פורת מהטכניון ואורי ינהלו דיון טכני על האתגרים במידול סטטי כזה. נדבר על יצירת העדפות, ועל האחריות המשפטית של מערכת ההמלצה. מערכת המלצה אמורה למדל אנשים, ואנשים הם לא יצור רציונאלי או עקבי - כיצד מערכת ההמלצה אמורה להתמודד עם זה? ונדבר על החשיבות של סימולציה למדידה ואימון מערכות המלצה, גם כאשר יש הרבה דאטא.   קישורים: Duelling bandits Recsim טווח ארוך לעומת טווח קצר במערכות המלצה

    Consistency Large Language Models עם מייק ארליכסון

    Play Episode Listen Later Jun 23, 2024 29:12


    למודלי שפה (גדולים) יש שלושה תת-מודלים: הטוקנייזר, הטרנספורמר, ואלגוריתם הפענוח. אלגוריתם הפיענוח בדרך כלל אינו נלמד, אלא הוא איזה שהיא יוריסטיקה סדרתית של חיפוש בעץ על סמך ההסתברויות של הטרנספורמר. אבל מי מבטיח שהיוריסטיקה הזו היא הדבר האידיאלי לעשות בהנתן הפלט של הטרנספורמר. Consistency LLMs מנסים לקשור את שתי הקצוות, ולהתאים את ההטרנספורמר לאלגוריתם הפענוח. מרוויחים מזה מודלים יעילות יותר, ואפשרות למיקבול. מייק יספר לנו איך הקסם הזה קורה

    Claim ExplAInable

    In order to claim this podcast we'll send an email to with a verification link. Simply click the link and you will be able to edit tags, request a refresh, and other features to take control of your podcast page!

    Claim Cancel