Hinter den Kulissen von Think Different! Think AI!

Shownotes

In dieser Sonderfolge gibt Mark einen Einblick in die Entstehung von Think Different, Think AI. Von Cover-Design mit KI über die Aufnahme und den Schnitt mit Riverside bis hin zur Audio-Optimierung mit Auphonic – hier erfahrt ihr, welche Tools und Workflows hinter dem Podcast stecken und wie KI punktuell unterstützt. Ein Blick ins Studio, während Jens im wohlverdienten Urlaub ist....

Zusatzinfos zur Sendung

Podigee
URL: https://www.podigee.com/

Podigee ist eine All-in-One-Plattform für das Hosting von Podcasts. Sie richtet sich an Kreative, Unternehmer und wachsende Unternehmen, die ihre Podcasts einfach veröffentlichen und verwalten möchten. Mit Podigee kannst du deine Episoden auf allen wichtigen Plattformen wie Apple Podcasts, Spotify und Amazon Music verbreiten. Die Plattform bietet detaillierte Analysen, um dein Publikum besser zu verstehen und zu vergrößern. Die Preise beginnen bei 19 US-Dollar pro Monat für den Basic-Plus-Plan, es gibt aber auch eine 14-tägige kostenlose Testversion.

Auphonic
URL: https://auphonic.com/

Auphonic ist ein intelligenter Audio-Postproduktionsdienst, der von über einer Million Nutzern geschätzt wird. Er fungiert als dein persönlicher KI-Toningenieur und verbessert die Audioqualität deiner Aufnahmen automatisch. Zu den Hauptfunktionen gehören die Rauschunterdrückung, das Ausbalancieren der Lautstärke und die Optimierung für verschiedene Wiedergabegeräte. Auphonic ist für bis zu zwei Stunden Audiomaterial pro Monat kostenlos und bietet darüber hinaus flexible Preismodelle. Die Plattform unterstützt alle gängigen Audio- und Videoformate und lässt sich nahtlos in bestehende Workflows integrieren.

Adobe Podcast
URL: https://podcast.adobe.com/

Adobe Podcast ist eine webbasierte Suite von KI-gestützten Audio-Tools, die deine Stimme professionell klingen lassen. Das herausragende Merkmal ist “Enhance Speech”, ein kostenloses Tool, das Hintergrundgeräusche und Echos entfernt und die Sprachqualität verbessert. Du kannst direkt im Browser aufnehmen, bearbeiten und transkribieren, ohne Software herunterladen zu müssen. Die Bearbeitung erfolgt intuitiv über ein Textdokument, was den Prozess erheblich vereinfacht. Für erweiterte Funktionen gibt es einen Premium-Plan.

Riverside.fm
URL: https://riverside.com/

Riverside.fm ist eine führende Plattform für die Aufnahme von HD-Podcasts und -Videos, die von Persönlichkeiten wie Michelle Obama und Mark Zuckerberg genutzt wird. Die Plattform zeichnet sich durch ihre lokale Aufnahmetechnologie aus, die für jeden Teilnehmer separate, qualitativ hochwertige Audio- und Videospuren in bis zu 4K-Auflösung gewährleistet. Die Bearbeitung wird durch KI-Funktionen wie textbasierte Bearbeitung, automatische Untertitel und “Magic Audio” vereinfacht. Es gibt einen kostenlosen Plan, und die kostenpflichtigen Pläne beginnen bei etwa 15 US-Dollar pro Monat.

Ferrite Recording Studio (iOS)
URL: https://www.wooji-juice.com/products/ferrite/App Store: https://apps.apple.com/app/ferrite-recording-studio/id1018780185

Ferrite Recording Studio ist eine leistungsstarke mobile App für die Aufnahme und Bearbeitung von Audio auf dem iPhone und iPad. Sie kombiniert die einfache Bedienung eines Diktiergeräts mit einem vielseitigen Mehrspur-Bearbeitungsstudio. Die App wurde speziell für Podcaster und Journalisten entwickelt und bietet professionelle Funktionen wie Effekte, Automation und die Unterstützung von bis zu acht Mikrofonen. Ferrite ist kostenlos im App Store erhältlich, wobei erweiterte Funktionen über In-App-Käufe freigeschaltet werden können.

Erwähnte KI Podcast Experimente

Prompt Intelligence: https://prompt-intelligence.podigee.

Schattenakte: https://schattenakte.podigee.io

404 Lachen nicht gefunden: https://404-lachen.podigee.io

Al Revolution: https://al-revolution.podigee.io

Kopf und KI: https://kopf-und-ki.podigee.io

Transkript anzeigen

Mark Zimmermann: Herzlich willkommen bei einer neuen Folge von Think Different, Think AI. Tja, was soll ich euch sagen? Wir haben uns vor einiger Zeit unterhalten mit unseren Gästen. Okay, wer hat nur einmal einen Gast? Muss man korrigieren an der Stelle mit René über das ganze Thema Wie wirkt sich KIRA auf Führung von Mitarbeitern aus auf das organisatorische Miteinander? Und Jens und ich hatten auch eine Folge, in der wir darüber gesprochen haben, ob KI Anspruch auf Urlaub hat. Nun ist euch bestimmt auch gefallen. Ich spreche hier alleine. Ich kann auch gar nicht an Jens das Wort übergeben, weil auch wenn Jens eine reale Person ist, hat er auch realen Urlaub. Und wir haben uns überlegt, was könnten wir in einer weiteren Folge für euch bringen, damit die Wartezeit, bis Jens wieder zurück ist, nicht so lang ist. Und wir haben uns überlegt, dass ich euch ein bisschen was darüber erzähle, wie dieser Podcast entsteht. So ein bisschen die technischen Hinterkunden. Die

Mark Zimmermann: Lass uns anfangen mit beispielsweise dem Cover. Jens setzt sich mit Manus hin und macht uns für jede Folge ein eigenes Cover und gibt quasi Manus die Anweisung, entsprechende Cover jedes Mal anzubinden, passen, damit mal beispielsweise das Symbol mit der Krawatte für Führung mit KI, teilweise Jens und ich mit der entsprechenden Pixel Grafik von früher. Ich fühle mich auch immer an Monkey Island und so erinnert. Generiert wird mit den entsprechenden Episoden Nummern in der Übersicht. Die Aufnahme selbst machen wir mit Riverside.fm. Das ist ein ziemlich etabliertes Podcast Tool, das einem ermöglicht, ein virtuelles Studio einzurichten. In diesem virtuellen Studio kann man Gäste einladen, die sich dann über App oder Browser dazuschalten können. Man kann sagen, wer alles moderationsrecht hat, wer Gast ist, wer nur Zuhörer ist und man bekommt eine sehr intuitive, würde ich sagen, Steuerung zur Verfügung gestellt, zu sehen, ob beispielsweise die Mikrofone gut ausgerichtet sind. Falls man einen Videopodcast machen will, kriegt man auch hier die Unterstützung. Was an Riverside auch extrem von Vorteil ist, Das ist die Möglichkeit des editieren. Klassischer Audioschnitt ist ja wirklich, man hat die Wellenform und versucht dann in dieser Wellenform entsprechende Pausen zu schneiden, Versprecher herauszuholen. Das ist mal mehr oder weniger kompliziert, zumindest mal für die Menschen, die sich mit Wellenform nicht so beschäftigen wollen. Und an der Stelle ist Riverside ganz nett, weil Riverside hat an der Stelle die Möglichkeit zu sagen, ich gehe an dir, ich kriege den kompletten gesprochenen Text pro Sprecher transkriptiert dargestellt. Ich kann den markieren und ich kann den entfernen. Und schon ist ein Satz unter Umständen einen Versprecher ärmer. Ich kann, während ich beispielsweise hier einen Monolog halte und falls mir Jens ins Wort fällt oder ich Jens ins Wort falle, bin ich auch in der Lage, jeweils andere Tonspur während jemand spricht auszublenden.

Mark Zimmermann: Und wenn man sich mal komplett verhaspelt hat und es fehlt vielleicht dann ein Satz, damit aus der Konversation wieder etwas Flüssiges wird, kann ich nicht nur Sätze löschen, Stille einfügen, sondern ich kann auch mit AI Voice Cloning entsprechende Wörter, Sätze, ganze Abschnitte von Riverside generieren lassen. Ist die Aufnahme dann geschnitten und quasi im Kasten? habe ich die Möglichkeit, mir jede Tonspur einzeln oder auch als gesamte Tonspur exportieren zu lassen. Und an der Stelle ist da haben wir noch nicht das, was wir quasi euch als Podcast zur Verfügung stellen, weil auch wenn Riffersite mir erlaubt, Audio Spuren zu schneiden und Texte zu ergänzen und auch eine kleine Stimmverbesserung schon von Haus drin hat und Mikrofonsteuerung bei der Aufnahme schon hat, ist Nichtsdestotrotz die Audioqualität manchmal noch nicht so optimal, sagen muss man so. Außerdem hört man manchmal die Gäste noch so bisschen atmen. Man hört manchmal noch so Füllwörter und damit das ein bisschen weniger wird und die Stimmen noch ein bisschen klarer werden. Die Pausen, die unter Umständen mal überlegen, entstanden sind, noch ein bisschen kürzer werden und die Atemgeräusche verschwinden. lade ich das Ganze dann danach in auf phonic.com. Phonic.com bietet im kostenlosen Account zwei Stunden, Audio-Material zu bearbeiten. Man kann auch gegen Eingriff von Münzen, wie wir es machen, mehr Material dadurch schicken. Man kann Audio- und Videodateien hochladen. Und das ist gefühlt eine Wundermaschine, was Audio-Qualität angeht. Viele von euch haben vielleicht mal von dem AI-Tool Adobe Podcast gehört. Adobe Podcast hat den Charme oder die Herausforderung, dass ich die von der Qualität nicht wirklich überzeugt bin. Adobe Podcast macht mir die Sachen irgendwie näher. Der versucht schon die Stimme zu isolieren, aber gerade die Atemgeräusche, die unnützen Pausen, da tut sich der Adobe Podcast schwer, weil er es gar nicht macht. Und auf Phonik macht das. Auf Phonik kann man aus verschiedenen Presets wählen.

Mark Zimmermann: Man kann die Presets auch durch eigene Konfigurationen ersetzen und da hat sich wirklich etabliert zu sagen, lösche unnötige Pausen, mache die Stimmen klarer, hebe alles auf einen Level und bearbeite so das Audio-File. Und das kann man sowohl für das gesamthafte Audio-File machen als auch für die einzelnen Tonspuren, sie dann später zusammenzusetzen. Meistens mache ich das für das gesamte Audio-File, wenn Jens und ich alleine sind. In der Folge mit René habe ich den Workflow ein bisschen angepasst, das bestmögliche Ergebnis für alle Beteiligten zu kriegen. Bin ich hingegangen und habe jede Tonspur, also die von René, die von Jens und die von mir einzeln durch euphonic gejagt. In dem Fall aber nicht die ich sage jetzt mal Pausen rausschneiden lassen, weil sonst wäre die Audio Spur ja nicht, ich sage jetzt mal, mehr kompatibel, sondern ich habe einfach nur die Stimmverbesserung gemacht. Und habe dann einen Schritt gemacht, den ich sonst nicht tue, nämlich das Ganze nochmal in eine Anwendung zu überführen, die heißt Ferret. Ferret läuft auf iOS und da kann man Tonspuren aneinander ausrichten. Da habe ich dann quasi erst alle Tonspuren einzeln durch Orphonic gejagt, dann über Ferret wieder verbunden und dann das Ergebnis nochmal durch Orphonic gejagt. Aber diesmal mit dem Hinweis, lass mal alles, was Audio ist, so wie es ist, lösche aber bitte alle unnötigen Pausen. Ja, und wenn das Ergebnis fertig ist, lädt man das auf Podigy. Podigy ist eine Distributionsplattform, die Podcasts entgegennimmt, also Audio-Dateien entgegennimmt und distributiert. Distributieren heißt dann zum Beispiel zu euch nach Spotify, Amazon Musik, Apple Podcasts, YouTube zu bringen. Das heißt, man lädt die Datei dort hoch. Es gibt eine App oder ein Web-Interface. Da kann man das wie gesagt als neue Folge zur Verfügung stellen. Man pflegt einen Titel, man pflegt einen Untertitel, man pflegt eine Show Note, lädt das Bild, das ich vorhin erwähnt habe, das Jens Bachett stellt hinein und dann kann man anhaken, dass Podigy nicht nur die Distribution übernimmt, sondern auch nochmal eine Transkription. Das ist dann der Grund, dass ihr in jeglichem Player oder auch im Web Interface dann auch eine einheitliche Transkription des Podcastes habt.

Mark Zimmermann: suchen könnt, wie, wo ist welches Wort gefallen, Texte heraus kopieren könnt. Wenn das Ganze dann entsprechend drin ist und wir haben Gäste, wird das Ergebnis dem Gast nochmal zur Verfügung gestellt, zur Freigabe. Jens und ich selbst brauchen keine gegenseitige Freigabe mehr. Das heißt, wenn nur wir beide zu Gast sind, wird das Ganze dann online geschaltet, online schalten heißt. antrückt im PodiG auf publizieren und hätte auch ein Datum eingeben können, zu wann der Podcast publiziert werden soll. Das wäre sinnvoll gewesen, Jens, wenn wir hier eine Folge schon vorher aufgenommen hätten, hätten wir die nämlich jetzt einfach mal raushauen können. Aber gut. Und dann geht die Folge online. Online heißt aber noch nicht, dass Menschen automatisch wissen, dass es die gibt. Treue höre unseres Podcasts. Wenn euch gefällt, gerne Freunden sagen Wir sammeln gerne noch Abonnenten. bekommen, dass zwar in ihrem Podcast Player zur Verfügung gestellt, aber es gibt ja auch noch ganz viele Menschen, noch gar nicht wissen, dass es unseren Podcast gibt. An der Stelle haben wir verschiedene Überlegungen, wie wir versuchen, auf Reichweite zu kommen. Das eine ist, dass jeder von uns, Jens und ich, zu unterschiedlichen Zeiten in ihren LinkedIn-Profilen Werbung für den Podcast machen. Also was ist in der Episode passiert? Manchmal schreiben wir auch LinkedIn-Artikel und verlinken den Podcast. Das so das Klassische. Was noch ein bisschen weitergeht, ist, dass wir, beziehungsweise, dass ich Manus auch nutze, nicht für das Cover-Build, sondern für die Werbung. Ich sage Manus, gehe auf die Webseite von dem Podcast, lese das Transkript ein, das auf der Webseite liegt. Wir erinnern uns, Podigy stellt das da zur Verfügung, ermittelt die wichtigen Schlagworte, suche nach diesen Schlagworten auf Social Media und in LinkedIn und verfasse mir Kommentarposts. bei den Artikeln, er gefunden hat, mit den Schlagworten eine entsprechende Rückmeldung zu geben, auf unserem Podcast zu verweisen. Das heißt, wenn wir zum Beispiel darüber sprechen, ob KI urlaubsberechtigt ist oder nicht, gucken wir, an welcher Stelle wird denn KI quasi als Kollege in einem Podcast, einem Podcast wollte ich schon sagen, einem Post erwähnt. Das wird, wie gesagt, per KI gesucht und dann wird ein wertschätzender Antwort.

Mark Zimmermann: Text geschrieben als Kommentar hinterlegt mit dem Link auf dem Podcast. Es läuft ganz gut. Also wir kriegen damit tatsächlich den einen oder anderen Hörer dazu, was die Statistik besagt. Wenn nicht gerade Fällen sind, man muss zugeben, Fällen sind ein bisschen der Download Knick, was die Podigy Download Zahlen angeht. Apropos Podigy Download Zahlen, Podigy macht nicht nur Distribution. Podigy macht auch Statistik. Das heißt, Wenn ich mir zum Beispiel anschaue, jetzt hier Think Different, Think AI, hat dann quasi, ich gucke jetzt gerade mal seit Veröffentlichung beispielsweise Boss Level KI mit René über 100 Downloads gehabt. Der einzige Podcast, der noch viel, besser lief mit über 150 Downloads bei KI als Kunde. Wir sind ganz glücklich mit unseren Downloads. Uns fehlen noch ungefähr 100 Downloads, dann haben wir die 750er Marke für uns voll. Es ist ja langsam wachsend. Wenn ich das vergleiche mit meinen anderen Podcasts, ich habe ja noch andere Podcasts, denen ich nicht in Person spreche. Ja, da wäre zum Beispiel 404 lachen nicht gefunden. Das ist ein Podcast, der wird komplett von Manus einmal die Woche, Dienstag, Mittwochs kreiert und online geschaltet. Und ich höre dann auch erst durch die Generierung von Manus, was die sich da haben einfallen lassen. Genauer genommen generiert Manus den Text. 11 Labs macht die Konversation zwischen einem IT-Leiter und seinem Erlebnis. Und das ist schon ziemlich lustig, teilweise, wenn man sich das anhört, weil nichts auf echten Geschichten basiert, beziehungsweise er recherchiert halt verschiedene Dinge auf Reddit und andere Quellen und versucht daraus sinngemäß eine lustige, sich nicht wiederholende Geschichte zu bauen. Kopf und KI ist für mich so ein bisschen der Versuch, ein bisschen mehr über KI zu lernen. Ich habe man uns gesagt mach doch bitte jede Woche eine Folge und Publiziere die damit ich ein bisschen auch damit auch ich ein bisschen besser noch in das Thema kreier reinkomme ist ganz lustig Schattenakte der fall der Woche da habe ich mal gesagt okay lass uns doch mal gucken mannus ob du es auch hinkriegst nicht nur eine kommet komödie also kommet die geschichte wie 404 zu machen mit unterschiedlichen sprechern und hilfe von 11 labs sondern versucht doch mal

Mark Zimmermann: eine Geschichte zu machen, die hauptsächlich von einem Kommissar erzählt wird über fiktive Fälle. Wichtig war mir beim Prompting an der Stelle, dass es fiktiv ist, damit man da bloß niemanden triggert, dass der sagt, den Fall kenne ich doch. Da habe ich mich letztens bisschen der Firma unterhalten, dass das Thema Prompting auch noch so Thema ist, wo sich Menschen vielleicht besser mit beschäftigen sollten. Habe ich dann Prompt Intelligence als Podcast gemacht. Da merke ich jetzt aber auch so langsam die Grenzen von den alten Promts, weil die alten Promts hatten Probleme oder haben Probleme mit Fremdsprachen. Wenn ich also einen Podcast aufsprechen lasse von 11 Labs und ähnliches und ich wechsle zwischen deutschen, englischen Worten, dann kommt der arg durcheinander. Von der Seite muss ich Kopf und KI und Prompt Intelligence mal irgendwann, wenn ich Zeit habe, verändern, dass die Promts ein bisschen anders werden, dass er... mehr Guidance kriegt, wie er englische Begriffe aussprechen soll oder nicht. Think Different, Think AI hört ihr ja, ne? Das ist ja komplett von Hand generiert. Also ich hab auch bei Think Different, Think AI noch nie das Thema Voice-Generierung verwendet, außer für unseren Titel. Ihr habt ja bei Think Different, Think AI das Intro und den Text. Mittlerweile kann man das ja mit 11 Labs Music machen. Damals haben wir es noch mit Zuno und Musik GPT gemacht und auch mit 11 Labs die Stimmen einsprechen lassen fürs Intro. Aber das war das Einzige, was wir bei diesem Podcast mit generieren lassen. Und ein anderer Podcast, der ganz leise wenige Zuhörer, den ich aber selbst total gerne höre, ist AI Revolution. AI Revolution ist ein rein englischsprachiges Format. Wer das abonniert, sieht eine Brille, sie Steve Jobs früher getragen hat, aber in der Brille spiegeln sich KI-Symboliken und das ist auch 100 % Manus. Mit dem Hinweis, guck mal, was die letzten Tage so passiert ist, wenn du genug zusammen hast für öffentliche Podcasts und verwende vom Satzbau etwas, das ich vorher sehr ausführlich habe eintrainieren lassen, dass er versucht, Sätze so zu formulieren.

Mark Zimmermann: wie uns Steve das vielleicht auf einer Bühne auch präsentiert hätte. Das ist auch ein sehr lustiges Experiment und wie ich finde auch ein sehr schönes Experiment, das einem zeigt, dass KI alleine durch System Prompting schon in der Lage ist, ansprechende, wie ich finde, Texte zu generieren. Den höre ich tatsächlich selbst jedes Mal mit absoluter Freude. Und wenn ich vergleiche, was sind so mein Lieblingspodcast abseits von ThinkDriven, Think.ai, weil ich die Gespräche mit Jens durchaus schätze, das ist jedes Mal eine Bereicherung, was wir da auf uns selbst, was wir als Thema haben, genieße ich einerseits den Comedian Podcast 404 und andererseits AI Revolution. Ja, das ist quasi unser Setup. Und damit haben wir hoffentlich dem einen oder anderen etwas zum Nachdenken gegeben. Würde mich freuen, wenn der ein oder andere auch mal nachschaut, ob vielleicht einer der automatisch generierten Podcasts auch was für ihn ist. Da würde mich total interessieren, was euch besonders positiv, vielleicht auch negativ auffällt, weil ich durchaus an diesem Podcasts weiter experimentieren möchte. Ich hoffe. dass wir bald wieder eine Folge aufnehmen können, wenn Jens zurück ist. Ich muss ehrlicherweise zugeben, in Vorbereitung dieser Folge habe ich vergessen, Jens zu fragen, wann er wieder da ist. Aber ich glaube, das kann nicht mehr so lange dauern. Und von daher hoffe ich, dass dieser kleine Sonder diese kleine Sonderausgabe euch gefallen hat und ihr uns erhalten bleibt. Bis zur nächsten Folge, wenn es heißt Think Different, Think AI. Und wie gesagt, wenn es euch gefällt, gerne weitersagen.

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.