sprachsynthese podcasts

573

Play Episode Listen Later Jan 22, 2026 22:16

KI ist vielfältiger als nur ChatGPT. Large Language Models eignen sich für Textarbeit, Bild-KI für Visualisierungen, Video-KI für personalisierte Avatare, Audio-KI für Transkription und Sprachsynthese, Prognose-KI für Datenanalyse. Führungskräfte sollten verschiedene KI-Typen verstehen und intelligent kombinieren, um strategische Entscheidungen zu treffen. ----------------------------------------------------------- Lesen Sie den kompletten Beitrag: 573

chatgpt mehr entscheidungen chatbots beitrag large language models auswertung datenanalyse visualisierungen avatare lesen sie transkription datenschutzerkl widerruf sprachsynthese anmeldeverfahren

Deep Dive 191 – Text-to-Speech mit Thorsten Müller

programmier.bar – der Podcast für App- und Webentwicklung

Play Episode Listen Later Sep 16, 2025 82:50

Immer mehr Geräte um uns herum sprechen mit uns. Was mit Screenreadern und Navigationssystemen begann, findet heute in unseren Wohnzimmern und Hosentaschen mit Alexa und Siri statt. Doch wie lernen Computer eigentlich zu sprechen? Und lässt sich sogar die eigene Stimme klonen?Darüber sprechen wir mit Thorsten Müller, dem Macher und der Stimme hinter Thorsten-Voice. Die Besonderheit an dem Open-Source-Projekt: Sprachausgabe wird hier lokal erzeugt, komplett ohne Cloud-Dienste. Es ist auf Grundlage Thorstens eigener Stimme trainiert und damit frei von rechtlich problematischen Trainingsdaten.Thorsten erzählt, was er beim Aufbau des Projekts gelernt hat und gibt Tipps für alle, die selbst mit Sprachsynthese experimentieren wollen. Gemeinsam werfen wir einen Blick auf die rasante Entwicklung der künstlichen Sprachausgabe. Neben Podcasting gibt es spannende Anwendungsfälle quer durch den Alltag.Schreibt uns! Schickt uns eure Themenwünsche und euer Feedback: podcast@programmier.barFolgt uns! Bleibt auf dem Laufenden über zukünftige Folgen und virtuelle Meetups und beteiligt euch an Community-Diskussionen. BlueskyInstagramLinkedInMeetupYouTubeMusik: Hanimo

deep dive computers dar blick tipps alltag immer entwicklung gemeinsam siri stimme bleibt aufbau schreibt macher thorsten meetups schickt projekts laufenden themenw anwendungsf text to speech wohnzimmern trainingsdaten die besonderheit cloud dienste hosentaschen sprachausgabe sprachsynthese screenreadern

#258 - KI an den Mikros: Luca 2.0 meldet sich zurück

Shape of Tomorrow

Play Episode Listen Later Apr 30, 2025 6:19

In Folge 197 war er das letzte Mal dabei, denn damals sprach ich mit meinem KI-Avatar Luca über die synthetische Realität. Über ein Jahr später hat sich in der Sprachsynthese jedoch einiges verändert – und in dieser Folge von Shape of Tomorrow könnte ich mir keinen besseren Host wünschen als Luca 2.0! Daher jetzt erst einmal genug von mir – diese Folge gehört heute der KI.

shape sich realit daher meldet mikros sprachsynthese

Ist selber Sprechen in Zeiten von KI noch sinnvoll?

zeig dich und sprich - Podcast fÃ¼r Experten*, die ihrer Botschaft eine Stimme geben wollen

Play Episode Listen Later Apr 27, 2025 20:37

Was passiert mit unserer Stimme, wenn KI täuschend echt für uns spricht? Was verändert sich für uns als Hörende und Sprechende dabei? Gemeinsam erforschen wir in dieser Folge, ob und warum selber sprechen zählt, was KI besser als wir kann und was du deshalb als Sprecher und Sprecherin beachten solltest. In dieser Folge erfährst du: *Was KI-Stimmen der menschlichen Stimme voraus haben – und was nicht *Was die menschliche Stimme wirklich ausmacht *Warum du weiterhin selber sprechen solltest *Wie du die Magie deines eigenen Sprechens bewusst nutzen kannst Die Shownotes/ weiterführende Links Instrument des Jahres 2025: Die Stimme Erfahre mehr über die Wahl der Stimme zum Instrument des Jahres 2025 und die geplanten Veranstaltungen:

Künstliche Intelligenz ändert alles!

Thomas Foster Musikproduktion Podcast

Play Episode Listen Later Jan 13, 2025 28:19

In dieser Podcast-Folge spreche ich gemeinsam mit Amber (ChatGPT) über die rasante Entwicklung neuer KI-Tools im Jahr 2024 und wie sie die Arbeit von Musikproduzenten radikal verändern. Egal ob Sprachsynthese, automatisierte Mix- und Mastering-Helfer oder Kompositionsassistenten – wir beleuchten, welche Chancen und Herausforderungen KI für uns Kreative mit sich bringt und wie wir sie sinnvoll in unseren Produktionsalltag integrieren können. Neugierig auf mehr? Dann wirf einen Blick in mein neues Buch „Künstliche Intelligenz in der Musik- und Audioproduktion“ – jetzt erhältlich auf Amazon: https://amzn.eu/d/gfoojon Hier geht's zum Video: Behind The Passion – Eine Thomann Dokumentation https://youtu.be/vpnNdijhyeY

amazon alles arbeit mix blick musik entwicklung chancen egal intelligenz kreative neugierig ki tools musikproduzenten buch k sprachsynthese

Auswirkungen des Klimawandels auf die Flusssysteme. Sprachsynthese-Forschung an der Slowakischen Akademie der Wissenschaften. (17.1.2024 15:30)

Die Slowakei hautnah, Magazin über die Slowakei in deutscher Sprache

Play Episode Listen Later Jan 17, 2024 24:29

Nachrichten, Tagesthema. Magazin: Auswirkungen des Klimawandels auf die Flusssysteme und Verfügbarkeit von Wasser. Sprachsynthese-Forschung am Institut für Informatik der Slowakischen Akademie der Wissenschaften.

auswirkungen wasser nachrichten institut forschung akademie klimawandels informatik wissenschaften sprachsynthese tagesthema

Stümperei³- Neues Jahr – Neues Glück

Halbwissen Hoch 2

Play Episode Listen Later Jan 7, 2024 32:55

Nach dem üblichen Weihnachts-Tohuwabohu und der eher trägen Silvester-Stimmung geht es nun auf ins Schaltjahr der spekulatiösen Halbweisheiten. Nach dem zu Beginn üblichen Tiefenfeuerwerk der Altherrenwitze ziemt sich Stephan an, über Herkunft und Bedeutung der Monatsnamen hinreichend unzulänglich aufzuklären. Pietsch spricht über das hohe Aggressionspotential der Gesellschaft zum Jahresausklang, zweifelt aber die Sinnhaftigkeit von Knallerverbot und Zentralfeuerwerk an. Nova zieht über Prequel-Sequels her und versinkt in wüsten Dünen fremder Welten, während Stephan die Action-Blockbuster der 80er hochleben lässt. Echte Masken und Effekte sind - wie geraffte Storylines – Grund genug, um ihn in die üblichen User-Storys verfallen zu lassen. Wie zu Weihnachten üblich, kommt aber auch hier im Podcast niemand am Essen vorbei und die bisherigen vielen Nachsätze kehren sich um, in echte Ausblicke auf gute Vorsätze für das Podcast-Jahr 2024. Stümperei³- … The great Farewell-Tour 2024 kick-off! Kritik, Themenvorschläge und Tassenbestellungen an: halbwissenhoch2@gmail.com

apple star trek dune terminator gesellschaft weihnachten bedeutung essen kritik beginn welten vors herkunft neues jahr effekte sinnhaftigkeit themenvorschl farewell tour podcast jahr ausblicke tie fighter jahresausklang pietsch generalstreik schaltjahr action blockbuster sprachsynthese

Sprachsynthese

FOCUS ON: Linux

Play Episode Listen Later Dec 17, 2023 32:11

Sprachsynthese-Software (TTS) ist, vor allem in den letzten Jahren, in aller Munde. So gibt es zahlreiche Projekte, die sich eine möglichst natürliche Stimme als Ziel gesetzt haben. TTS-Enthusiast Thorsten Müller hat es sich zur Aufgabe gemacht, seine eigene Stimme zu synthetisieren und teilt seine Beweggründe und Erfahrungen. Das neueste Highlight: der erste in ein Modell gegossene Regiolekt.

erfahrungen ziel stimme sprache aufgabe projekte modell munde beweggr tts coqui sprachassistent sprachsynthese

Elevenlab - Text-to-Speech-KI

Sandra Mareike Langs Bildung rockt! - Der Lerncoaching Podcast: Mindset | Tools | neues Lernen | Digitalisierung | ErMUTigung

Play Episode Listen Later Jul 16, 2023 32:58

Entdecke, wie Dir Elevenlab zur Sprachsynthese bei der Produktion von Audio-Inhalten helfen kann. Du kannst Stimmen erstellen, die verblüffend menschliche klingen, entweder mit KI-genierten Stimmen oder mit Deiner eigenen Stimme. Elevenlab bietet verschiedene Preismodelle und Zeitkontingente an. Dieses Tool ist sehr leicht in der Handhabung und Bedienung. Wie Dir Elevenlab bei der Content-Erstellung hilft, in der neunen Podcast-Episode:

bis kontakt chancen stimme lass stimmen bildung produktion komm deiner entdecke deine meinung handhabung bedienung text to speech content erstellung dieses tool preismodelle sprachsynthese

Google schlägt zurück: Bard wurde verbessert und wir vergleichen es mit ChatGPT & mehr News von Googles I/O | "KI und Mensch" | Folge 8, Teil 1

KI und Mensch

Play Episode Listen Later May 20, 2023 92:33

Auf der jüngsten Entwicklerkonferenz Google I/O hat der Tech-Konzern viel über seine AI-Pläne verraten und viele Neuentwicklungen vorgestellt. Schwerpunkt war der mit Palm 2 verbesserte AI-Chatbot "Bard" (die direkte Konkurrenz zu #ChatGPT und #Bing) vorgestellt. Wir zeigen und erklären wie Bard funktioniert und was seine Vorteile und Schwächen gegenüber der Konkurrenz sind.Google hat auch neue Sprach-, Bild- und Musikerzeugungsfähigkeiten vorgestellt sowie Tools zur Programmunterstützung und Integration in andere Google-Dienste wie GMail.Ein weiterer Konkurrent von OpenAI, Anthropic, hat eine neue Version von ihrem Sprachmodel "Claude" vorgestellt, das extrem lange Texte (über 75.000 Wörter! ) verarbeiten kann, was für Forschung und Redaktionsarbeit hilfreich sein kann. Google hat kürzlich 300 Mio. US-Dollar in Anthropic investiert.Im Audio- und Musikbereich macht Google große Fortschritte. Wir zeigen SoundStorm und Googles Demos für AudioLM und MusicLM. KI-gestützte Sprachsynthese und -erkennung wird auch in Google-Geräte wie Pixel eingesetzt und kann auch im Alltag durch Anwendungen auf dem Handy benutzt werden.Im medizinischen Bereich könnten KI-Assistenten wie Googles neues Palm-2-Modell Ärzten helfen, Diagnosen genauer zu stellen.Hinweis: Dieses Video ist ein Teil/Ausschnitt der Live-Sendung vom 20. Mai 2023.*Link-Liste*_Bard_https://bard.google.com/?hl=en(aktuell nur über VPN, via UK oder USA, in Deutschland benutzbar). Kostenloses VPN (zum Ausprobieren): https://hide.me/de/_Palm 2_https://www.cnbc.com/2023/05/16/googles-palm-2-uses-nearly-five-times-more-text-data-than-predecessor.htmlPalm 2 Tech Report https://t.co/MXqCy1lPZO_Google I/O_Übersicht über alle Inhalte: https://io.google/2023/https://www.theverge.com/2023/5/10/23717120/google-search-ai-results-generated-experience-iohttps://www.theverge.com/2023/5/10/23718088/google-android-14-ai-wallpaper-messages-magic-compose-iohttps://www.theverge.com/2023/5/10/23718301/google-ai-workspace-features-duet-docs-gmail-io_SoundStorm / AudioLM / MusicLM_https://google-research.github.io/seanet/soundstorm/examples/https://google-research.github.io/seanet/audiolm/examples/https://ai.googleblog.com/2022/10/audiolm-language-modeling-approach-to.htmlhttps://google-research.github.io/seanet/musiclm/examples/https://blog.google/technology/ai/musiclm-google-ai-test-kitchen/ https://aitestkitchen.withgoogle.com_Mehr von/zu Google_Coding in Colab: https://blog.google/technology/developers/google-colab-ai-coding-features/Duet AI: https://9to5google.com/2023/05/10/google-workspace-duet-ai/AI in Google Workspace: https://workspace.google.com/solutions/ai/PaLM API (Coding): https://twitter.com/marktenenholtz/status/1656380980402475008Vergleich Bard vs GPT-4/Bing: https://twitter.com/emollick/status/1656475460996399104Google Codey: https://9to5google.com/2023/05/10/google-codey-programming-generative-ai/*Folgt uns auf:*Twitter: https://twitter.com/KIundMenschTwitch: https://www.twitch.tv/kiundmenschYoutube: https://www.youtube.com/@kiundmensch

united states ai google uk tools chatgpt deutschland mehr integration alltag mensch schl bild openai bereich vorteile schw handy inhalte palm bard gmail bing gpt pixel forschung texte modell vpn konkurrenz wurde schwerpunkt mio us dollar fortschritte anthropic anwendungen vergleichen ausprobieren und wir diagnosen google workspace colab sprach konkurrent verbessert live sendung duet ai tech report neuentwicklungen musiclm google dienste sprachsynthese

Expedition Arbeit #177 - [VUKAwelt Barcamp] ChatGPT meets ChatFSt: Audio-Miniatur 2 “Die Kunst der Zukunftsgestaltung”

Expedition Arbeit

Play Episode Listen Later Mar 9, 2023 15:21

[ Hinweis aus der Redaktion: Der ChatGPT-Sprach-Sound ist ein bisschen nervig - so wie das Tool, werden manche sagen. Man höre zum Zustandekommen der Sendung mein (wohlklingendes) Show-Intro. In Kürze: Die Sendung wird es dann noch mal in einer 2.0-Version geben, mit "echter" Sprachsynthese für den Chatbot-Part] #experimente #expedition #künstlicheintelligenz #natürlichesrisiko Show Notes Sendung 177 ChatGPT, Website des Anbieter Open AI Manfred Brandstätter bei LinkedIn Die Organisationstgestalter, Website VUKAwelt Barcamp - Website und Tickets Community-Veranstaltungen, Frühjahr 2023 WeSession, immer mittwochs von 18-19 Uhr, Zoom-Link https://us02web.zoom.us/j/83275054887?pwd=M3RyU0NaK2lJUXloSEwyQm53aDVZdz09 Expedition Arbeit Basecamp Leipzig, 10./11.03.23, Info & Tickets Expedition Arbeit Basecamp Freiburg, 31.03.23, Info & Tickets Expedition Arbeit Basecamp Franken/Fürth, 29.04.23, Info & Tickets VUKAwelt Barcamp Bonn, 05.05.23 MITGLIED WERDEN Expedition Arbeit wünscht sich viele, neue Mitglieder: Denn dann können wir gemeinsam mehr bewirken, außerdem schaffen wir nur ab einer gewissen Größe die gewünschten Netzwerk- und Matching-Effekte. Vor allem aber glauben wir, dass wir nur mit ganz vielen auch ganz viel in Sachen sinnstiftender, selbstbestimmter und wirksamer Arbeit erreichen können. Mitglied werden ist einfach. Kündigen übrigens auch. Weil es eben kein Abo ist, sondern eine Mitgliedschaft. Alles dazu findet Ihr auf unserer Website oder direkt auf der Crowdfunding-Plattform Steady: https://steadyhq.com/de/expeditionarbeit/about Kommt an Bord, seid dabei, lasst uns etwas bewegen! ALLGEMEINE LINKS zu Expedition Arbeit Ideen, Anregungen und Kritisches an die Redaktion: florian@expedition-arbeit.de Expedition Arbeit-Mitglied werden Mitglied bei Expedition Arbeit werden Du willst in der Community mitmachen? Dann melde dich bei Der öffentliche Expedition Arbeit-Newsletter Unsere halböffentliche LinkedIn-Gruppe Unsere öffentliche LinkedIn-Seite Expedition Arbeit bei Twitter Expedition Arbeit, Event-Kalender Community Management und Host Community Radio: Florian Städtler bei LinkedIn Redaktionsleitung: Wolfgang Pfeifer Sprecherin Zwischenmoderationen: Stefanie Mrachacz Schnitt und Mix: Yannik Mattes Die Musik und SFX (Sound-Effekte) in allen Sendungen stammen von der Plattform bzw. von Florian Städtler

Siren_web_client.exe

NDR Hörspiel Box

Play Episode Listen Later Jan 4, 2023 54:30

Ein KI-Audioexperiment von Christine Nagel über Sprachsynthese. Eine Radio-Moderatorin nutzt ein individuelles Sprachsynthese- und Sprech-Erkennungstool, um ihre persönliche KI-Stimme zu entwickeln. Als sie das Spiel ins Laufen bringt, meint sie Freiheit zu gewinnen. SIREN, Maries künstliche Stimme, verbindet sich mit allen möglichen lebenden und toten Geistern im Netz, unter anderem mit Hannah Arendt, deren Äußerungen und Ideen verfügbar geblieben sind. SIREN stellt ihr Fragen, die unsere Gegenwart betreffen. Christine Nagels Hörspiel thematisiert, was die Digitalisierung mit der menschlichen Stimme machen kann - und das, was (möglicherweise) nicht gelingt. Dies betrifft zum Beispiel ethische, rechtliche und Fragen der Firmenphilosophie der Anbieter und Programmierer von Sprachtools. Neuronale Netzwerke ermöglichen, dass sich KI-Stimmen selbst generieren. Sie reichern sich an mit Wissen und Strukturen des im Internet verfügbaren Materials. Doch wer ist der Urheber? Wer übernimmt die Verantwortung für die Lügen, die durch sie in der Welt sind und Marie zugeschrieben werden? Und: Was ist das Menschliche an der Stimme? Die KI-Stimme SIREN wurde für diese Hörspiel-Produktion programmiert. Damit befragt Christine Nagel spielerisch die technischen Entwicklungen unserer Gegenwart mit den dem Hörspiel eigenen Mitteln und stellt akute, gesellschaftspolitische Fragen. Mit Paulina Bittner (Marie), Ilse Ritter (Seele), Dietrich Eichmann (Dr. Leopold Gran, Redakteur in Ruhestand), Paul Hentze (Theobald Fahl, Redakteur), Lauren Newton (Gesangslehrerin), Lena Stolze (Ärztin), Manuel Bittorf (Sprechstundenhilfe), Birgit Beßler (Bankangestellte), einer KI-Stimme sowie Prof. Ingo Siegert, KI-Forscher Joscha Bach und Stimmen aus dem täglichen Leben. Idee, Manuskript und Regie: Christine Nagel. Komposition und Sprachaufnahmen: Peter Ehwald. Gesang: Lauren Newton. Tonschnitt und Mischung: Laura Schneider. Dramaturgie: Michael Becker. Produktion im Auftrag von NDR/DLF 2021. Gefördert durch die Senatsverwaltung für Kultur und Europa. https://ndr.de/radiokunst

internet europa clients prof leben welt als gef idee wissen damit ideen beispiel spiel kultur freiheit stimme verantwortung materials entwicklungen stimmen digitalisierung netz produktion gegenwart strukturen auftrag laufen siren mitteln anbieter hannah arendt ruhestand redakteur und was menschliche geistern komposition programmierer urheber maries manuskript firmenphilosophie senatsverwaltung sprachsynthese neuronale netzwerke

Folge 92: Lara und Tom stellen sich vor

Büchergefahr

Play Episode Listen Later Nov 20, 2021 6:37

Alles neu. Alles spannend. Wir tauschen hier nicht nur die Schrammelmusik gegen Chillout-Klänge ein, wir holen auch gleich zwei neue Stimmen mit an Board. Es sind Lara und Tom. Beide sind zwar zu hören, aber es gibt sie gar nicht wirklich. Diese Stimmen sind nämlich künstlich. Dieser Kanal ist somit runderneuert. Schauen wir mal, wo das hinführt. Links Neue Intro- und Outro-Musik: Chillout von Ronald Kah Newsletter der Büchergefahr

ai board alles newsletter sich stimmen stellen beide schauen chillout sprachsynthese dieser kanal ronald kah

Spracherkennung mit KI

Fraunhofer-Podcast: Forschung erleben – Zukunft hören

Play Episode Listen Later Nov 5, 2021 18:33

"Sprache ist zu komplex und auch zu dynamisch und verändert sich, als dass die Maschinen das komplett fehlerfrei hinbekommen. Wir möchten den Menschen Hilfsmittel an die Hand geben, komplexe Vorgänge mit Sprache der Maschine mitzuteilen und die Maschine in die Lage versetzen, diese komplexen Vorgänge zu verstehen", sagt Dr. Joachim Köhler vom Fraunhofer IAIS im Podcast. Gesprochene Sprache ist eine der wichtigsten Arten der Kommunikation. Mit der auf dem deutschen Markt führenden KI-basierte Spracherkennungstechnologie kann das Fraunhofer IAIS gesprochene Sprache erkennen, in Text umwandeln und so durchsuchbar machen. Dies zeigt eindrucksvoll die Zusammenarbeit mit der ARD und ihren Sendern. Auch in der Interaktion mit technischen Systemen ersetzt das gesprochene Wort mehr und mehr die Tastatur oder graphische Benutzeroberflächen – Sprachassistenten werden zur Kerntechnologie für die Mensch-Maschine-Kommunikation. Auch hier kommt künstliche Intelligenz zum Einsatz und bietet einen natürlichen Zugang zu Produktangeboten und Dienstleistungen. Experten aus den Bereichen Sprachsignalverarbeitung, Sprachverstehen, künstlicher Intelligenz und Software-Engineering arbeiten derzeit an einer skalierbaren, mehrsprachigen und offenen Sprachassistenzplattform namens SPEAKER für die deutsche Industrie und den deutschen Mittelstand. Ziel des Projektes ist der Aufbau einer führenden Sprachassistenzplattform „Made in Germany“ für Business-to-Business-Anwendungen (B2B). Die Plattform soll offen, modular und skalierbar sein und Technologien, Dienste und Daten über Serviceschnittstellen bereitstellen. Dazu sollen führende Technologien der Audiovorverarbeitung, Spracherkennung, Natural-Language-Understanding (NLU), Question Answering (QA), Dialogmanagement und Sprachsynthese mittels künstlicher Intelligenz (KI) und Machine Learning zur einfachen und unkomplizierten Nutzung verfügbar gemacht werden. Webseite des Fraunhofer IAIS https://www.iais.fraunhofer.de Projekt-Website SPEAKER: https://www.speaker.fraunhofer.de/ Geschäftsfeld Speech Technologies am Fraunhofer IAIS: https://www.iais.fraunhofer.de/de/geschaeftsfelder/speech-technologies.html Dialogsysteme am Fraunhofer IAIS: https://www.iais.fraunhofer.de/de/geschaeftsfelder/speech-technologies/dialogsysteme.html Übersichtsseite zur KI-Forschung am Fraunhofer IAIS: https://www.iais.fraunhofer.de/de/forschung/kuenstliche-intelligenz.html

ai business speaker mit gesch ziel dazu wort kommunikation lage machine learning sprache einsatz experten markt zusammenarbeit intelligenz daten zugang arten aufbau industrie nutzung ard technologien vorg maschine maschinen dienstleistungen interaktion software engineering dienste systemen mittelstand intelligenz ki projektes mit ki tastatur die plattform sprachassistenten sendern benutzeroberfl spracherkennung sprachsteuerung ki forschung artificial inteligence joachim k sprachsynthese

Otaku Nation - Klangkomposition über Pachinko und japanische Gaming-Kultur

Hörspiel - Deutschlandfunk Kultur

Play Episode Listen Later Jul 22, 2021 58:03

Automatengedüddel, ratternde Stahlkugeln, Geräusche von Tasten, Joysticks und Controllern: Hörstück über das Pachinko-Spiel mit Abstechern zum Nō-Theater, zur Shinto-Mythologie, Yakuza-Kultur und zu KI-gestützter Sprachsynthese. Von Udo Moll www.deutschlandfunkkultur.de, Klangkunst Hören bis: .. Direkter Link zur Audiodatei

gaming kultur otaku pachinko tasten joysticks direkter link abstechern sprachsynthese

Siren_web_client.exe

NDR Hörspiel Box

Play Episode Listen Later Mar 10, 2021 54:30

Hörspiel-Experiment von Christine Nagel. Eine Radio-Moderatorin nutzt ein individuelles Sprachsynthese- und Sprech-Erkennungstool, um ihre persönliche KI-Stimme zu entwickeln. Als sie das Spiel ins Laufen bringt, meint sie Freiheit zu gewinnen. SIREN, Maries künstliche Stimme, verbindet sich mit allen möglichen lebenden und toten Geistern im Netz, unter anderem mit Hannah Arendt, deren Äußerungen und Ideen verfügbar geblieben sind. SIREN stellt ihr Fragen, die unsere Gegenwart betreffen. Christine Nagels Hörspiel thematisiert, was die Digitalisierung mit der menschlichen Stimme machen kann - und das, was (möglicherweise) nicht gelingt. Dies betrifft zum Beispiel ethische, rechtliche und Fragen der Firmenphilosophie der Anbieter und Programmierer von Sprachtools. Neuronale Netzwerke ermöglichen, dass sich KI-Stimmen selbst generieren. Sie reichern sich an mit Wissen und Strukturen des im Internet verfügbaren Materials. Doch wer ist der Urheber? Wer übernimmt die Verantwortung für die Lügen, die durch sie in der Welt sind und Marie zugeschrieben werden? Und: Was ist das Menschliche an der Stimme? Die KI-Stimme SIREN wurde für diese Hörspiel-Produktion programmiert. Damit befragt Christine Nagel spielerisch die technischen Entwicklungen unserer Gegenwart mit den dem Hörspiel eigenen Mitteln und stellt akute, gesellschaftspolitische Fragen. Die Programmierung erfolgte in Zusammenarbeit mit dem Institut für Informations- und Kommunikationstechnik, Universität Magdeburg, Prof. Dr.-Ing. Ingo Siegert, und mit Joscha Bach, Kognitionswissenschaftler & KI-Forscher in San Francisco. Die Schauspielerin Paulina Bittner, deren Stimme zugrunde liegt, wurde im Studio immer wieder mit einem neuen Programmierstadium konfrontiert und reagierte im Dialog darauf. Dieser halb-dokumentarische Ansatz macht das Hörspiel zu einem Experiment: Ob und in welche Richtung sich die künstliche Intelligenz im Verlauf der Programmierung entwickeln würde, war bei Beginn der Aufnahmen nicht vorhersehbar. Mit Paulina Bittner (Marie), Ilse Ritter (Seele), Dietrich Eichmann (Dr. Leopold Gran, Redakteur in Ruhestand), Paul Hentze (Theobald Fahl, Redakteur), Lauren Newton (Gesangslehrerin), Lena Stolze (Ärztin), Manuel Bittorf (Sprechstundenhilfe), Birgit Beßler (Bankangestellte), einer KI-Stimme sowie Prof. Ingo Siegert, KI-Forscher Joscha Bach und Stimmen aus dem täglichen Leben. Idee, Manuskript und Regie: Christine Nagel. Komposition und Sprachaufnahmen: Peter Ehwald. Gesang: Lauren Newton. Tonschnitt und Mischung: Laura Schneider. Dramaturgie: Michael Becker. Produktion im Auftrag von NDR/DLF 2021 l ca. 55 min. Gefördert durch die Senatsverwaltung für Kultur und Europa. Verfügbar bis 10.03.2022. https://ndr.de/radiokunst

internet san francisco europa clients prof leben welt als experiments studio gef idee wissen damit ideen beispiel universit spiel kultur freiheit stimme beginn verantwortung zusammenarbeit intelligenz materials entwicklungen richtung dieser stimmen digitalisierung netz institut dialog produktion ansatz gegenwart strukturen ing auftrag laufen siren verlauf mitteln anbieter aufnahmen hannah arendt ruhestand magdeburg redakteur und was menschliche programmierung geistern komposition programmierer urheber maries manuskript joscha bach firmenphilosophie senatsverwaltung sprachsynthese neuronale netzwerke

Otaku Nation - Klangkomposition über Pachinko und japanische Gaming-Kultur

Hörspiel - Deutschlandfunk Kultur

Play Episode Listen Later Jul 3, 2020 58:05

Automatengedüddel, ratternde Stahlkugeln, Geräusche von Tasten, Joysticks und Controllern: Hörstück über das Pachinko-Spiel mit Abstechern zum Nō-Theater, zur Shinto-Mythologie, Yakuza-Kultur und zu KI-gestützter Sprachsynthese. Von Udo Moll www.deutschlandfunkkultur.de, Klangkunst Hören bis: 19.01.2038 04:14 Direkter Link zur Audiodatei

gaming kultur otaku pachinko tasten joysticks direkter link abstechern sprachsynthese

Neulich – Die Morningshow am Nachmittag – S02E07

Neulich – Die Morningshow am Nachmittag

Play Episode Listen Later Mar 27, 2020 65:41

Von Text to speech zu Speech to Text: Heute dreht sich alles um vermenschlichte Lautsprecher, die gerne so schlau sein wollen wie eine richtige Person. Wir analysieren die Quote zwischen weiblichen und männlichen SprecherInnen und suchen Alternativen in einer “Genderless Voice”.

speech siri stimme morning show alternativen smart homes nachmittag bixby smart speakers lautsprecher neulich sprecherinnen sprachsynthese

Blick 316 auf Voice Cloning, Voice Mimics und Deepfakes

Blick über den Tellerrand

Play Episode Listen Later Sep 20, 2019 11:57

Der zweite Teil des Schwerpunkts zu Sprachsynthese, Voice Cloning, Voice Mimics und Deepfakes.

voice blick deepfakes cloning mimics sprachsynthese schwerpunkts

Blick 315 auf Voice Avatare, Polly und Sprachsynthese

Blick über den Tellerrand

Play Episode Listen Later Sep 15, 2019 13:58

Der 315. Blick mit dem Schwerpunkt Voice Avatar, Voice User Interfaces, SSML und Polly.

voice blick avatare sprachsynthese ssml

Frequenz | Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Serien

Play Episode Listen Later May 28, 2019 54:24

Podcasts gelten weiterhin als Trendmedium. Aber wieviele on demand Audioshows kursieren derzeit eigentlich im deutschsprachigen Raum? Was sind die beliebtesten Themenfelder, die wichtigsten Hostingplattformen und wo lohnt es sich genauer hinzuschauen? Wir werfen einen analytischen Blick hinter die Zahlenkulissen bei Apple Podcasts. Außerdem beschäftigen wir uns mit der Frage, ob Podcasts demnächst zum Textmedium werden, denn Techniken wie automatisierte Transkripte und Sprachsynthese entwickeln sich immer weiter. Aktuell kursiert ein täuschend echtes Audio-Deepfake des US-Podcasters Joe Rogan. Shownotes: Apple Podcasts Zahlen von Dirk Primbs Real Talk Sprachsynthese und Joe Rogan Audio Deepfake Fake Joe Rogan (Audio Deepfake Turing Test) Audiomanipulation: Drunk Nancy Pelosi Pick (Christian): Soundtrap virtuelles Studio im Browser Pick (Nicolas): Vernetztes Hören mit Swoot Zur Podcastepisode: viertausendhertz.de/frq47

apple podcasts studio joe rogan blick raum analyse deepfakes aktuell techniken frequenz themenfelder soundtrap transkripte sprachsynthese textmedium

Frequenz | Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Viertausendhertz | Talk

Play Episode Listen Later May 28, 2019 54:24

Podcasts gelten weiterhin als Trendmedium. Aber wieviele on demand Audioshows kursieren derzeit eigentlich im deutschsprachigen Raum? Was sind die beliebtesten Themenfelder, die wichtigsten Hostingplattformen und wo lohnt es sich genauer hinzuschauen? Wir werfen einen analytischen Blick hinter die Zahlenkulissen bei Apple Podcasts. Außerdem beschäftigen wir uns mit der Frage, ob Podcasts demnächst zum Textmedium werden, denn Techniken wie automatisierte Transkripte und Sprachsynthese entwickeln sich immer weiter. Aktuell kursiert ein täuschend echtes Audio-Deepfake des US-Podcasters Joe Rogan. Shownotes: Apple Podcasts Zahlen von Dirk Primbs Real Talk Sprachsynthese und Joe Rogan Audio Deepfake Fake Joe Rogan (Audio Deepfake Turing Test) Audiomanipulation: Drunk Nancy Pelosi Pick (Christian): Soundtrap virtuelles Studio im Browser Pick (Nicolas): Vernetztes Hören mit Swoot Zur Podcastepisode: viertausendhertz.de/frq47

apple podcasts studio joe rogan blick raum analyse deepfakes aktuell techniken frequenz themenfelder soundtrap transkripte sprachsynthese textmedium

Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Frequenz

Play Episode Listen Later May 27, 2019 54:24

Podcasts gelten weiterhin als Trendmedium. Aber wieviele on demand Audioshows kursieren derzeit eigentlich im deutschsprachigen Raum? Was sind die beliebtesten Themenfelder, die wichtigsten Hostingplattformen und wo lohnt es sich genauer hinzuschauen? Wir werfen einen analytischen Blick hinter die Zahlenkulissen bei Apple Podcasts. Außerdem beschäftigen wir uns mit der Frage, ob Podcasts demnächst zum Textmedium werden, denn Techniken wie automatisierte Transkripte und Sprachsynthese entwickeln sich immer weiter. Aktuell kursiert ein täuschend echtes Audio-Deepfake des US-Podcasters Joe Rogan. Shownotes: Apple Podcasts Zahlen von Dirk Primbs Real Talk Sprachsynthese und Joe Rogan Audio Deepfake Fake Joe Rogan (Audio Deepfake Turing Test) Audiomanipulation: Drunk Nancy Pelosi Pick (Christian): Soundtrap virtuelles Studio im Browser Pick (Nicolas): Vernetztes Hören mit Swoot Zur Podcastepisode: viertausendhertz.de/frq47

apple podcasts studio joe rogan blick raum analyse deepfakes aktuell techniken themenfelder soundtrap transkripte sprachsynthese textmedium

Frequenz | Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Viertausendhertz | Alle Podcasts

Play Episode Listen Later May 27, 2019 54:24

Podcasts gelten weiterhin als Trendmedium. Aber wieviele on demand Audioshows kursieren derzeit eigentlich im deutschsprachigen Raum? Was sind die beliebtesten Themenfelder, die wichtigsten Hostingplattformen und wo lohnt es sich genauer hinzuschauen? Wir werfen einen analytischen Blick hinter die Zahlenkulissen bei Apple Podcasts. Außerdem beschäftigen wir uns mit der Frage, ob Podcasts demnächst zum Textmedium werden, denn Techniken wie automatisierte Transkripte und Sprachsynthese entwickeln sich immer weiter. Aktuell kursiert ein täuschend echtes Audio-Deepfake des US-Podcasters Joe Rogan. Shownotes: Apple Podcasts Zahlen von Dirk Primbs Real Talk Sprachsynthese und Joe Rogan Audio Deepfake Fake Joe Rogan (Audio Deepfake Turing Test) Audiomanipulation: Drunk Nancy Pelosi Pick (Christian): Soundtrap virtuelles Studio im Browser Pick (Nicolas): Vernetztes Hören mit Swoot Zur Podcastepisode: viertausendhertz.de/frq47

apple podcasts studio joe rogan blick raum analyse deepfakes aktuell techniken frequenz themenfelder soundtrap transkripte sprachsynthese textmedium

Hör mal, wer da spricht - Mensch oder Maschine?

Netzteil – Der Tech-Podcast

Play Episode Listen Later Jul 31, 2018 20:04

Wenn Googles experimentelle Software mit uns spricht, klingt sie wie ein Mensch aus Fleisch und Blut. Andere Programme lernen in wenigen Minuten, die Stimmen beliebiger Personen zu imitieren. Dank künstlicher Intelligenz haben dieses Voice Cloning und die Sprachsynthese zuletzt riesige Fortschritte gemacht. Wie kann man das selbst ausprobieren? Was können künstliche Stimmen für uns tun? Und wie verhindern wir, dass sie uns täuschen? Darüber sprechen Teresa Sickert, Netzwelt-Redakteur Patrick Beuth - und ihre beiden Software-Klone. See omnystudio.com/listener for privacy information.

software dar mensch dank personen intelligenz stimmen blut fleisch spricht fortschritte maschine voice cloning sprachsynthese

TB044: Der stinkende Fernseher

Die Technikblase

Play Episode Listen Later May 8, 2017 56:19 Transcription Available

Nach einer Woche Pause gibt es einiges aufzuholen. Zunächst sprechen wir über eine Sprachsynthese der besonderen Art. Lyrebird.ai verspricht, aus einer einminütigen Sprachaufnahme einer beliebigen Person die Stimme synthetisieren zu können.Dadurch kann ein Computer mit der Stimme des Betreffenden dann jeden beliebigen Text sprechen. Ein paar Beispiele gibt's auch gleich.rnrnrnrnWeiter geht's mit einem amazon.de block. Zunächst eine Nachricht in eigener Sache: Sowohl für all-in.de, als auch für die Technikblase gibt's inzwischen Amazon Alexa Skills in der Beta.rnrnDann begeistert (hust,hust) amazon mit dem Echo Look. Einem persönlichen Fashion-Assistenten. Ja wer will denn keine Kamera und ein Mikrofon im Schlafzimmer? Gerne hätten wir allerdings den "Echo Knight" mal ausprobiert. Ein Alexa Gerät mit Display.rnrnEin neues Display hat auch Stephan. Sein Schnäppchen ist allerdings ein rechter Stinker und trübt dadurch etwas den Sehgenuss...rnrnEinige Geräte sehen nicht, sondern hören. Und zwar auf Ultraschalltöne, die sie prompt für die Nachverfolgung von Nutzern im "richtigen Leben" ausnutzen.rnrnMichael hat Probleme beim Buchen des Telekom StartTV Angebots. Der rosa Riese will ihm nämlich seine 50Mbit/s Hybrid-Verbindung wegnehmen, wenn er StartTV buchen will.rnrnWindows 10s ist als abgespeckte Variante von Windows 10 angekündigt und verursacht mehr Kopfzerbrechen als Jubelrufe. Edge und Marketplace-Zwang finden wir nicht so toll.rnrnEbenso nervig ist die Preisstufen-Anpassung in Apples App Store. In Europa ist jetzt nämlich 1,09€ statt 99ct der niedrigste Preis. Dafür scheint sich eine Einigung zwischen Apple und Amazon was die Prime Video App für den Apple TV 4 betrifft abzuzeichnen. Jeff Bezos und Tim Cook haben sich - so wird gerüchtet - getroffen und mal Tacheles geredet.

amazon art apple europa leben computers jeff bezos windows apple tv probleme beta stimme display einem preis nachricht beispiele kamera mikrofon tim cook dadurch variante zun fernseher einigung stinker nutzern riese tacheles buchen woche pause kopfzerbrechen lyrebird nachverfolgung apple's app store echo look sprachaufnahme amazon alexa skills sprachsynthese betreffenden echo knight

TechTalk 008 Amazon Alexa - Faszination Sprachassistent

KuUBuS MetaCast

Play Episode Listen Later Jan 8, 2017 62:51

Was ist Alexa? Amazons Sprachassistent Alexa ist seit kurzem per Einladung in Deutschland erhältlich. Das Meisterstück von Spracherkennung und Sprachsynthese ist besonders für Blinde und Sehbehinderte und Menschen mit anderen körperlichen Behinderungen eine Technologie mit ungeahntem Potential. Was ist Echo und Echo Dot, was kann Alexa, wo und wie bekomme ich Alexa? All diese Fragen rund um Amazons Sprachassistentin beantworten Yasin und Stephan in der aktuellen Spezial-Folge des TechTalk Podcasts.

deutschland technologie einladung faszination tech talk amazon alexa spezialfolge blinde yasin behinderungen amazon echo dot sehbehinderte spracherkennung sprachassistent sprachsynthese

008 Amazon Alexa - Faszination Sprachassistent

TechTalk (Der Technik-Podcast von Cap4Free und KuUBuS)

Play Episode Listen Later Jan 8, 2017 62:51

Was ist Alexa? Amazons Sprachassistent Alexa ist seit kurzem per Einladung in Deutschland erhältlich. Das Meisterstück von Spracherkennung und Sprachsynthese ist besonders für Blinde und Sehbehinderte und Menschen mit anderen körperlichen Behinderungen eine Technologie mit ungeahntem Potential. Was ist Echo und Echo Dot, was kann Alexa, wo und wie bekomme ich Alexa? All diese Fragen rund um Amazons Sprachassistentin beantworten Yasin und Stephan in der aktuellen Spezial-Folge des TechTalk Podcasts.

deutschland technologie einladung faszination amazon alexa spezialfolge blinde yasin behinderungen amazon echo dot sehbehinderte spracherkennung sprachassistent sprachsynthese

Hatsune Miku & Vocaloid – DG117

delamar Guitar - Gitarre spielen lernen & Gitarrenunterricht & Equipment

Play Episode Listen Later Mar 26, 2016 37:39

Henry stolperte über ein Pedal, das Gitarrentöne zur Sprachsynthese nutzt – das Korg Miku Stomp synthetisiert die Stimme der japanischen Anime-Kunstfigur Hatsune Miku, einem virtuellen Mädel, das im Land der aufgehenden Sonne schier unfassbare Popularität... Der Beitrag Hatsune Miku & Vocaloid – DG117 erschien zuerst auf delamar.FM.

land stimme sonne pedal popularit hatsune miku vocaloid sprachsynthese

CRE109 Computer-Telefonie-Integration

CRE: Technik, Kultur, Gesellschaft

Play Episode Listen Later Feb 18, 2009 85:44

CTI ist das Schmuddelthema der IT: niemand redet darüber. Die Ausnahme ist Chaosradio Express. Im Gespräch mit Tim Pritlove erläutert Lars Immisch Geschichte und Gegenwart der Computer-Telefonie-Integration. Inhalt ist sind sowohl Hardware-Technologie als auch Protokolle, Anwendungen und Trends. Zur Sprache kommen: erste Steckkarten mit analogen Telefonschnittstellen, erste Standards zur Massenbehandlung von Telefonleitungen, Signalisierung und Sprachencoding, Wählverfahren, Behandlung von Durchwahlen und automatische Assistenten, moderne Bussysteme für Telefoncomputer mit hoher Leitungsdichte, Spracherkennung und Sprachsynthese, Telefon-APIs und freie Software zur Entwicklung von Telefonie-Sprachanwendungen.

software computers standards integration entwicklung im gespr gegenwart behandlung anwendungen cti assistenten protokolle telefonie spracherkennung zur sprache tim pritlove sprachsynthese telefonleitungen chaosradio express

Podcasts about sprachsynthese

Best podcasts about sprachsynthese

NDR Hörspiel Box

Hörspiel - Deutschlandfunk Kultur

Blick über den Tellerrand

Latest podcast episodes about sprachsynthese

573

Deep Dive 191 – Text-to-Speech mit Thorsten Müller

#258 - KI an den Mikros: Luca 2.0 meldet sich zurück

Ist selber Sprechen in Zeiten von KI noch sinnvoll?

Künstliche Intelligenz ändert alles!

Auswirkungen des Klimawandels auf die Flusssysteme. Sprachsynthese-Forschung an der Slowakischen Akademie der Wissenschaften. (17.1.2024 15:30)

Stümperei³- Neues Jahr – Neues Glück

Sprachsynthese

Elevenlab - Text-to-Speech-KI

Google schlägt zurück: Bard wurde verbessert und wir vergleichen es mit ChatGPT & mehr News von Googles I/O | "KI und Mensch" | Folge 8, Teil 1

Expedition Arbeit #177 - [VUKAwelt Barcamp] ChatGPT meets ChatFSt: Audio-Miniatur 2 “Die Kunst der Zukunftsgestaltung”

Siren_web_client.exe

Folge 92: Lara und Tom stellen sich vor

Spracherkennung mit KI

Otaku Nation - Klangkomposition über Pachinko und japanische Gaming-Kultur

Siren_web_client.exe

Otaku Nation - Klangkomposition über Pachinko und japanische Gaming-Kultur

Neulich – Die Morningshow am Nachmittag – S02E07

Blick 316 auf Voice Cloning, Voice Mimics und Deepfakes

Blick 315 auf Voice Avatare, Polly und Sprachsynthese

Frequenz | Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Frequenz | Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Frequenz | Apple Podcasts Analyse, Audio Deepfake mit Joe Rogan, Soundtrap Browserstudio

Hör mal, wer da spricht - Mensch oder Maschine?

TB044: Der stinkende Fernseher

TechTalk 008 Amazon Alexa - Faszination Sprachassistent

008 Amazon Alexa - Faszination Sprachassistent

Hatsune Miku & Vocaloid – DG117

CRE109 Computer-Telefonie-Integration