• 12 Sep, 2024

Whisper AI narzędzie od Open AI, zamieniaj nagrania w tekst, oraz rób napisy do filmów za darmo

Whisper AI narzędzie od Open AI, zamieniaj nagrania w tekst, oraz rób napisy do filmów za darmo

W tym artykule przygotowałem dla Ciebie konkretny poradnik jak tworzyć teksty do filmów czy wyciągać teksty z nagrań audio. Mowa tutaj o narzędziu Whisper AI które świetnie radzi sobie z przepisywaniem tekstu z pliku, który mu wskażemy. Dodatkowo cały proces możemy wykonać za darmo na swoim koncie google. Zobacz jakie to proste z narzędziem Google Collaborate.

Robienie napisów do filmów za darmo online z Whisper AI

Nowe narzędzie od filmy Open AI, pozwala wykonać transkrypcję plików audio na tekst. Może być to przydatne kiedy chcemy zrobić np. napisy do filmu na swoim kanale YouTube czy inne platformy, jak TikTok, Facebook czy Instagram. Dodatkowo Whisper AI dodaje znaki czasowe do nagrania, przesłanie ich w takim formacie nałoży je idealnie w momencie wypowiadanych słów na filmie, aby całość była spójna. Oczywiście wiele firm udostępnia to narzędzie płatnie, w tym poradniku pokażę Ci jak zrobić to za darmo z wykorzystaniem narzędzia Google Collaborate!

Poradnik jak za darmo korzystać z Whisper AI

  1. Zakładam, że każdy z moich czytelników ma konto gmail.com. Jeśli nie, musisz je utworzyć. Po założeniu darmowego konta pocztowego, w google dostajemy dostęp do szeregu innych usług w tej platformie. Jedną z nich jest Dysk google, to właśnie tam musimy przejść.
    wejscie na dysk google w gmail (1)
  2. Teraz otworzy nam się nasz dysk google, z lewej strony klikamy na przycisk + Nowy, następnie wybieramy Więcej, i Podłącz więcej aplikacji
    dodanie nowej uslugi do konta google gmail collaborate (1)
  3. U samej góry wpisujemy nazwę aplikacji (Collaborate),  którą chcemy dodać do naszego dysku google. 
    instalowanie usługi na dysku google Collaborate (1)
     
  4. Po wybraniu aplikacji wystarczy, że klikniemy Zainstaluj. (następnie dalej i Gotowe)
    instalacja aplikacji google colaboratory w dysku google (1)
  5. Po zainstalowaniu usługi na naszym koncie google pojawi się nowa opcja, wracamy do naszego dysku google i znowu wybieramy + Nowy, Więcej, lecz tym razem klikamy w nazwę aplikacji Google Colaboratory (otworzy się ona w nowym oknie)
    otiweranie uslugi od google colaboratory (1)
  6. Teraz wybieramy u góry Środowisko wykonawcze, następnie Zmień typ środowiska wykonawczego (otworzy nam się okienko gdzie wybieramy T4 GPU i dajemy zapisz)
    zmiana srodowiska wykonawczego w aplikacji google colaboratory (1)
  7. Już teraz możemy rozpocząć pobranie i zainstalowanie Whisper AI na naszej maszynie google. Wystarczy że wkleimy poniższe komendy i damy uruchom:
    !pip install git+https://github.com/openai/whisper.git 
    !sudo apt update && sudo apt install ffmpeg
    instalacja whisper ai na narzedziu google colaboratory (1)
     
  8. Po zakończonym, pobraniu oraz instalowaniu aplikacji Whisper AI, możemy zacząć jej używać. Wystarczy, że przygotujemy plik np. mp3, gdzie mamy jakiś test. (plik może mieć maksymalnie 25 mb, inaczej nie zostanie przerobiony w całości, oczywiście jeśli Twój plik audio waży np. 50mb wystarczy, że potniesz go na 2 kawałki i dasz do transkrypcji do Whisper AI najpierw pierwszy plik potem drugi, przy cięższych plikach trzeba będzie podzielić na więcej części i troszkę się z tym pobawić (zawsze wcześniej możesz skompresować taki plik audio, aby ważył mniej - większość takich rzeczy zrobisz za darmo korzystając z narzędzi online). Oczywiście jeśli masz plik wideo do którego chcesz zrobić napisy to wyciągasz z niego ścieżkę dźwiękową i zapisujesz do .mp3, załóżmy że już masz przygotowany swój plik audio i waży on 20 mb. 
  9. Nasz plik przesyłamy teraz do narzędzia Google Colaboratory 
    (1. tak wygląda poprawnie pobrany i zainstalowany Whisper AI)
    (2. Przechodzimy do pliki)
    (3. przesyłamy nasz plik .mp3 z dysku komputera)
    (4. teraz klikamy w + Kod aby móc wykonać kolejne polecenie)
    zakonczona instalacja dodajemy plik audio do tlumaczenia przez whisper zamien audio w tekst (1)
     
  10. Jak widzisz ja, przesłałem już plik o nazwie test.mp3 (kiedy będziesz przesyłać swój plik zwróć uwage czy skończył on wysyłanie, zanim uruchomisz narzędzie Whisper do transkrypcji audio na tekst)
    przeslany plik do transkrypcji w whisper ai (2)

    teraz wykonujemy polecenie, które rozpocznie transkrypcję naszego pliku:
    !whisper "TUTAJPODAJSWOJĄNAZWĘPLIKU.mp3" --model medium --language pl 
    i wybieramy strzałkę, aby uruchomić polecenie.
  11. Jeśli wszystkie kroki wykonałeś tak jak ja, na ekranie powinien zacząć po chwili pojawiać się tekst z nagrania audio. Dodatkowo z lewej strony wygenerują się pliki z tekstem do pobrania. (poniżej jak to wyglądało u mnie):
    wygenerowane napisy wykonane przews whisper transkrypcja tekstu z pliku audio (1)
     
  12. Oczywiście Whisper ma wiele opcji konfiguracji np. długość linii tekstu, czy ustawienie ilości tekstu na nagraniu w liniach wszystkie te opcje znajdziesz po wpisaniu polecenia:
    !whisper -h

Zamiana nagrań na tekst podsumowanie

Jak widzisz całość jest naprawdę mega prosta i za pomocą 3 poleceń jesteśmy w stanie z pomocą Whispera zmienić pliki audio na pliki tekstowe, a działa to naprawdę całkiem nieźle! Ja korzystałem z tego narzędzia już kilkanaście razy tworząc napisy do filmów na youtube i poradził sobie naprawdę świetnie. Bez problemu zrozumiał również nagrania, w których część tekstu została zmieniona na język angielski. Polecam przetestować samemu! W razie problemów zostaw komentarz, a postaram się pomóc!