NA SKRÓTY
Piotr Peszko
+48 605 570 195
ppeszko@gmail.com

Jak szybko napisać tekst, kiedy nie masz na to czasu?

Jak szybko napisać tekst, kiedy nie masz na to czasu?

31 października 2017

Raz, dwa, trzy, próba mikrofonu… Oto tekst mojego autorstwa, który nie został napisany przeze mnie. Jak to możliwe?

Zacznę od opisania sytuacji: codziennie spędzam około dwóch godzin w samochodzie, a coraz częściej brakuje mi czasu i przestrzeni na pisanie bloga. Stwierdziłem więc, że skoro istnieją redaktorzy i korektorzy, mogę sprytnie pozbawić się części swego problemu i wykorzystać umiejętności któregoś z nich do tworzenia kolejnych wpisów. Działa to następująco: jadąc, opowiadam jakąś historię, która ma stanowić podstawę późniejszego tekstu pisanego. Takie działanie powoduje jednak powstanie problemu natury ideowej, który zawiera się w pytaniu, jak to, co mówię, przełoży się na wersję zapisaną, a więc ile mnie zostanie w tekście i czy to nadal będzie mój tekst? Wczoraj udało mi się rozwiać większość moich obaw. Uświadomiłem sobie, że sama redakcja to nie wszystko – tekst trzeba przygotować, opublikować, a potem nadać mu oryginalny charakter, mój charakter.

Arianna Huffington podpowiedziała rozwiązanie

Skąd w ogóle przyszło mi do głowy, że taka współpraca to dobry pomysł? Myśl tę zaczerpnąłem z jednego z ostatnich odcinków podcastu Tima Ferrissa (dla porządku chodzi o odc. 264), w którym rozmawia on z założycielką The Huffington Post – jednego z bardziej poczytnych portali informacyjnych i blogów zarazem. Nie będę opisywał, czego dotyczyła dyskusja, na potrzeby naszych rozważań weźmy pod uwagę tylko jedno z poruszonych w jej trakcie zagadnień. Arianna Huffington – autorka wielu książek, pomysłodawczyni i szefowa The Huffington Post – przyznała, że na pewnym etapie działalności twórczej borykała się z podobnym problemem. Kiedy pisała, cierpiała na przypadłość, którą można by określić jako (do pewnego stopnia nieuświadomiony) perfekcjonizm – dużo czasu spędzała, zastanawiając się, czy takie a nie inne słowo powinno się znaleźć w takim a nie innym zdaniu.

Dyktowanie jako sposób na twórczy blok

Nie pozwalało jej to przygotować pierwszej wersji książki i blokowało twórczo, gdyż przy każdej stronie zachodziła w głowę, czy napisany fragment tekstu jest na tyle dobry, by przekazać go czytelnikom. Wtedy ktoś zasugerował jej, żeby szkic książki powstawał drogą dyktowania – nagrywania wypowiedzi na odpowiednie urządzenie lub przekazywania werbalnie komuś, kto je zapisze. Dopiero nad takim gotowym brudnopisem (już w formie papierowej) siadała autorka z zespołem redaktorskim, by cyzelować treści i konstrukcje. Skoro więc taka gwiazda współczesnych mediów, wśród licznych publikacji której znajdują się nie tylko te dotyczące biznesu, ale nawet… mitologii greckiej, może posługiwać się tą metodą, to dlaczego samemu nie spróbować? W moim przypadku pierwszy szkic artykułu też nie jest papierowy – z racji swoistej niemożności oraz chęci efektywnego wykorzystania czasu, a przede wszystkim pragnienia niezaniedbywania bloga mogę je tworzyć właśnie w ten sposób.

PREZENTACJERobię

Mam nadzieję, że metoda ta okaże się całkiem dobra

Niech kontynuację tych rozważań stanowi temat, który pojawiał się już na grupie E-learning robię, a więc motyw transkrypcji treści. W tym zakresie technika pozwala nam korzystać z trzech narzędzi.

Pierwszym, najmniej przeze mnie poznanym, jest IBM Watson Speech. Narzędzie obiecywało dużo, ale niestety nie byłem w stanie skorzystać z oferowanej usługi, bo interfejs aplikacji jest mało intuicyjny, a na liście dostępnych języków (English, Japanese, Arabic, Mandarin, Portuguese, Spanish, French) niestety nie ma polskiego.

 

Trint

Drugie z narzędzi nazywa się Trint i zostało stworzone przez start-up, który wyspecjalizował się w tworzeniu i wykorzystywaniu algorytmów umożliwiających transkrypcję fonetyczną treści. Proces polega na tym, że siadamy z mikrofonem przy komputerze i dyktujemy tekst (lub uploadujemy plik z nagranym głosem), a aplikacja na jego podstawie tworzy draft książki czy artykułu.

Mówimy więc coś bezpośrednio do mikrofonu albo przesyłamy plik wideo ze ścieżką dźwiękową lub plik audio (oczywiście ścieżka audio powinna być dobrej jakości), po czym program zwraca nam całkiem poprawną transkrypcję, którą następnie możemy edytować, by stworzyć jakiś materiał na tej samej zasadzie, na jakiej eksperymentalnie tworzymy wpis, który właśnie czytacie.

Dla mnie fenomenalne jest to, że Trint przeprowadził transkrypcję godzinnego pliku audio w 9 minut! 

Jedynym minusem, jaki zauważyłem po upłynięciu okresu próbnego, był wysoki (przynajmniej dla mnie) koszt transkrypcji.  Pozostaje liczyć na to, że ceny tego typu usług będą maleć lub nawet że staną się one bezpłatne. Modele dystrybucji ciągle się zmieniają, więc póki co dywagowanie na ten temat nie ma większego sensu.

KALENDARZSzkoleń

Niezawodny Google

Ostatnie narzędzie, o którym chciałem powiedzieć, pokonuje pozostałe, jeśli chodzi o dostępność, miałem też już okazję skorzystać z niego przy pracy nad jednym z projektów. Mowa o Google Docs. Zauważcie, że firma ta także wyposażyła już swoje dokumenty w narzędzie do „dyktowania”.

Przyznam szczerze, że podchodziłem do niego z pewną dozą sceptycyzmu – nie wierzyłem, aby było ono w stanie w pełni poprawnie rozpoznawać głos (szczególnie po polsku). Wcześniej korzystałem z iPhone’owego Notatnika, który wykorzystywałem zwłaszcza w sytuacji, gdy przygotowywałem dla lektorów skrypty do kursów e-learningowych. Miałem czasami trudność, żeby skrypt mówiony brzmiał rzeczywiście jak mówiony. W takim przypadku ów skrypt sobie po prostu dyktowałem, dzięki czemu przez fakt wypowiadania zyskiwał on na naturalności. (To taka wskazówka dla osób z e-learningu).

Krótkie porównanie

W przypadku Google Docs w pierwszej kolejności wypróbowałem transkrypcję w języku angielskim i muszę przyznać, że wypadła ona idealnie – chociaż to stwierdzenie może częściowo wynikać z faktu, że nie jestem native speakerem, a więc moja ocena może być nieco zaburzona. (Na co dzień posługuję się jednak językiem angielskim, a rezultat działania algorytmu określiłbym jako, jak to mówią Brytyjczycy, „good enough”).

Jedyny minus w porównaniu do programu Trint stanowił fakt, że Google Docs nie radził sobie w ogóle ze znakami interpunkcyjnymi. Ciekawe jest to, że aplikacja ta rozpoznaje za to bardzo poprawnie inne języki – miałem okazję przetestować ją na gruncie polszczyzny i na tym polu działa ona naprawdę dobrze.

Co prawda gdy próbujemy sczytać dane z pliku audio, program miewa minimalne problemy z rozpoznawaniem treści, ale z drugiej strony zaskoczył mnie pozytywnie, gdy podyktowałem mu tekst z wykorzystaniem najprostszego mikrofonu wbudowanego w zwyczajną słuchawkę do prowadzenia rozmów, a on nie miał większych problemów z rozszyfrowaniem go. Co ciekawe im bardziej potoczyście o czymś opowiadałem, tym wynik był bardziej satysfakcjonujący – może używałem wtedy prostszych słów.

Tryb transkrypcji w aplikacji Google Docs działa tak, że trzymając jednocześnie dłonie na klawiaturze, można uzupełniać w tekście interpunkcję (program nie robi tego samodzielnie). Myślę, że jest to bardzo sprytne rozwiązanie, szczególnie jeśli chcemy tego tekstu przygotować sporo i robimy właśnie taki „brudnopis”. Nie wiem, jak wyglądałoby to w przypadku czytania jakiegoś tekstu – skoro mamy go już w formie pisemnej i chcemy go przeczytać, by na przykład dostosować go pod wypowiedź lektora, to myślę, że tu mógłby już powstać problem. Do tworzenia notatek głosowych nadaje się jednak moim zdaniem wyśmienicie.

Pora na konkluzję

O ile ja w tym wpisie wykorzystuję inteligencję, lecz nie sztuczną, a wrodzoną i nabytą redaktora-korektora, z którym współpracuję, o tyle mechanizm działania narzędzi, o których mówiłem do tej pory, oparty jest na sztucznej inteligencji i przetwarzaniu danych. Zdaję sobie sprawę, że jesteśmy w stanie tworzyć różne grafy językowe i tego typu obiekty, ale lepiej będzie, jeśli na ten temat będą wypowiadać się specjaliści.

Swoją drogą jeśli znacie fachowców, z którymi można by na ten temat porozmawiać i nagrać podcast, podrzućcie mi namiary na nich w komentarzach – bardzo chętnie zaproszę ich do dyskusji na temat tego, jak można modelować język, to może być naprawdę ciekawy temat.

Fakt faktem sztuczna inteligencja towarzyszy nam coraz częściej i w coraz większym zakresie. Myślę, że sam wkrótce trochę przybliżę kilka tematów z nią związanych, bo zjawisko to wydaje się bardzo trudne do ogarnięcia, ale wbrew pozorom na swoim logicznym czy ideowym poziomie jest dość proste.

WEBINARYRobię

Jeśli natomiast chodzi o narzędzia do dyktowania czy transkrypcji, będą się one upowszechniać, a z biegiem czasu staną się tańsze, a także – lepsze dla użytkowników końcowych. Dlaczego? Dlatego że samo używanie takiego narzędzia oznacza uczenie go. Uświadomcie sobie, że w każdym języku istnieje ogromna, ale ograniczona liczba zdań, z których się na co dzień korzysta (język jest żywy, więc konstrukcje się zmieniają, ale ich liczba pozostaje określona).

Lepsza inteligencja żywa, czy sztuczna?

Myślę więc (nie umniejszając roli redaktorów i korektorów), że za bardzo niedługo, i mam tu na myśli naprawdę kilka lat, te narzędzia elektroniczne staną się na tyle dobre, że będą w stanie wykonywać zadania, o których mówiliśmy, tak samo dobrze lub, zaryzykuję, nawet lepiej niż żywi korektorzy czy edytorzy, gdyż będą mogły jednocześnie taki dyktowany tekst tłumaczyć na inne języki i udostępniać w nowych wersjach.

To nie jest żadna bajka czy opowiadanie science-fiction oparte na gdybaniu, co się może kiedyś wydarzyć – to już się zaczyna dziać i być komercjalizowane w postaci nie tylko B2B, ale też B2C. Z biegiem lat będziemy coraz częściej posługiwać się narzędziami, które nam ta sztuczna inteligencja daje. Co więcej – już się nimi posługujemy, tylko nie zdajemy sobie z tego sprawy, gdyż producenci sprzętu i oprogramowania nie chcą nas straszyć tym, jak szeroko wykorzystują dane, które zbierają ze wszystkich urządzeń, które posiadamy.

Tak oto kończy się eksperyment polegający na stworzeniu notatki głosowej i wpisu na jej podstawie. Proszę Was bardzo o informację zwrotną, czy zauważacie jakieś różnice pomiędzy tym tekstem i tekstami, które tworzyłem do tej pory. I jeszcze jedna prośba: spróbujcie te narzędzia, o których mówimy, przetestować – zobaczyć, czy to faktycznie działa (zwłaszcza ten produkt Googla – jak on się Wam sprawdza, jakie macie wrażenia z jego stosowania, czy sądzicie, że to jest dobry sposób). Czy uważacie, że ta sztuczna inteligencja nam pomoże, czy wręcz przeciwnie –wypada się jej bać? Czy może należy być jak Elon Musk i z jednej strony mówić, że to jest zło, a z drugiej – w to zło inwestować? Zastanówmy się, porozmawiajmy o tym. Do następnego.

""
1
Previous
Next
o-autorze
Piotr PESZKO

Urodziłem się w małym mieście na Podkarpaciu, tam po raz pierwszy zmuszono mnie tego, żeby zdobyć formalne wykształcenie, chociaż wolałem social learning, zbieranie puszek po napojach i przesiadywanie godzinami przed komputerem w poszukiwaniu szybszej metody na wczytanie gry z kasety do swojego Commodore 64.