Blog / Whisper AI

Ik wilde testen of mijn app goed werkte en besloot mijn gedachten hardop uit te spreken terwijl ik bezig was. Zojuist heb ik Whisper AI geïnstalleerd op mijn MacBook. Whisper AI is een open-source tool uit de keuken van OpenAI waarmee je  transcriptietool die audiobestanden omzet in tekst, zelfs in andere talen.

Het proces is eenvoudig: je uploadt een audiobestand, en de tool zet de spraak automatisch om in tekst. In mijn geval sprak ik Nederlands, wat je kunt selecteren met een paar commando's. Ik heb nog geen grafische interface. Alles moet via de 'Terminal' op m'n Mac, maar het werkt.

Geen programmeur? Geen probleem!

Ik ben geen programmeur en heb weinig geduld voor het oplossen van technische problemen. Maar met een beetje hulp van ChatGPT kwam ik verrassend ver. Ik stelde vragen, kreeg duidelijke uitleg en kon direct doorvragen bij fouten. Dit maakte het hele proces een stuk toegankelijker.

Een eigen transcriptie-app bouwen?

Door deze ervaring kreeg ik een idee: een eenvoudige transcriptie-app. Een tool waarin je een audiobestand uploadt en met één druk op de knop een transcript krijgt. Ideaal als je weinig tijd hebt en alleen minimale correcties wilt doen. Misschien een soort Notion, maar dan voor spraaknotities. Of dat deze app automatisch m'n gedachtenspinsels kan uploaden naar Notion.

Hoe ik Whisper AI installeerde

De installatie ging grotendeels soepel. Met wat basisinstructies van ChatGPT voerde ik de juiste terminal-commando’s in. Toch liep ik even vast op een bepaalde pip-versie, waardoor ik een virtuele Python-omgeving moest opzetten. Gelukkig was dat snel opgelost, en had ik een een relatief korte tijd Whisper AI draaiende.

Wat heb ik geleerd?

Dit experiment liet me zien hoe toegankelijk AI-tools zijn, zelfs zonder technische achtergrond. Met de juiste begeleiding kun je zelf tools installeren en aanpassen. Misschien is dit wel het begin van een nieuwe hobby!