Casa Ressenyes Revisió i valoració de la llarga

Revisió i valoració de la llarga

Taula de continguts:

Anonim

El registre i la transcripció de converses o reunions pot ser difícil. És per això que molts que necessiten fer-ho poden recórrer als serveis de transcripció. Otter adopta un enfocament innovador de la tasca, oferint transcripcions en temps real de converses i reunions a mesura que es produeixin. També integra altres funcions, com ara la identificació d’altaveus de conversa creuada, bones eines de cerca i excel·lents aplicacions per a mòbils, tot i que algunes funcions són una mica aspres al voltant de les vores. La lletja és més precisa que la majoria de serveis automàtics, però encara no és una alternativa viable als serveis basats en humans. Fins que Otter millori les seves tecnologies, recomanem Editors 'Choice Rev per als vostres treballs importants de transcripció. Tanmateix, per a reunions o notes personals improvisades, Otter pot funcionar bé.

Plans de preus

Otter ofereix un pla gratuït i de pagament. Amb el pla gratuït, els usuaris obtenen 600 minuts de transcripcions al mes. La versió gratuïta no restringeix cap altra funció de l'aplicació o de la interfície web. També agraeixo que Otter no mostri anuncis en la seva versió gratuïta.

El nivell de compte Premium permet als usuaris transcriure 6.000 minuts d'àudio al mes. Otter cobra 9, 99 dòlars mensuals per aquest pla, tot i que podeu estalviar diners si pagueu anualment a un ritme de 79, 99 dòlars anuals. Els estudiants i professors també obtenen un descompte, pagant només 2, 99 dòlars mensuals per aquest pla. A més dels minuts de transcripció addicionals, Otter Premium inclou suport de correu electrònic prioritari i properament oferirà opcions d’exportació avançades.

A títol comparatiu, el servei de transcripció automàtica de Scribie és completament gratuït, encara que no disposa d’una aplicació per a mòbils. El pla de subscripció més barat de Trint cobra 15 dòlars al mes amb un màxim de tres hores d’àudio carregat. Temi, un altre servei automàtic, costa 0, 10 dòlars el minut.

Els serveis basats en humans costen més, atès el capital humà que requereixen i les taxes de precisió millorades. La majoria cobra per minut, normalment en un rang d’entre 1 i 3 dòlars. Rev, per exemple, cobra una tarifa base d’1 $ per minut per cada minut d’àudio que sol·liciteu. Així, juntament amb d’altres, també augmenta el preu si afegeix opcions addicionals al treball de transcripció com ara identificacions de altaveus i timestamps, o fins i tot si la gravació d’àudio és de mala qualitat.

Com funciona la llúdriga

Al seu nucli central, Otter és un servei de transcripció ambiental que es basa en el reconeixement automàtic de la veu (ASR) per processar els vostres enregistraments en temps real. Tot el que heu de fer és prémer el botó de registre, començar a parlar i veure que apareixen les vostres paraules a l'aplicació. Fins i tot afegeix una puntuació adequada i separa parlants individuals (encara que amb resultats mixtos). Segons la nostra experiència, triguen un parell de minuts a aparèixer la transcripció a l'aplicació, però després s'actualitza en temps real. Detallem el rendiment d’Otter en la nostra prova de precisió en una secció posterior de la revisió.

La tecnologia ASR d’Otter és similar a la d’altres serveis que hem revisat, inclosos Scribie, Temi i Trint. La tecnologia subjacent està desenvolupada per un grup anomenat AI Sense; s'integra especialment amb el Videoconferència servei, Zoom

Per si teniu curiositat, no hi ha res especial sobre el nom, Otter. Sí, sembla una mica "utter". Tot i això, el meu contacte va oferir una millor explicació: les llúdrigues són animals simpàtics. En qualsevol cas, estic d’acord que les llúdrigues són criatures fantàstiques i agraeixen el logotip.

En la seva política de privadesa, Otter explica que xifra els seus serveis amb SSL. És una bona idea llegir la política de privadesa d'AI Sense per veure exactament quina informació recopila Otter i com utilitza les vostres dades. Otter obté punts per explicar clarament les seves polítiques de dades. Una cosa positiva és que podeu eliminar els vostres fitxers en qualsevol moment. això és bastant estàndard a tots els serveis de transcripció.

Otter no permet als usuaris configurar una autenticació de dos factors, cosa decebedora. Qualsevol servei que allotgi informació potencialment sensible hauria d’habilitar aquesta mesura de seguretat per defecte. Dit això, els serveis automàtics són inherentment més segurs ja que no hi ha cap altre ésser humà al final del procés que tingui accés als vostres fitxers (potencialment) sensibles.

Transcripcions realment mòbils

Otter ofereix aplicacions tant per a Android com per a iOS. La configuració és fàcil: només cal que descarregueu l’aplicació des de la botiga d’aplicacions respectiva i creeu-ne un compte. Hem instal·lat l’aplicació tant en un Google Pixel que funciona amb Android 8.1 com en un iPhone 8 amb iOS 11, tot i que la majoria de les nostres revisions es refereixen a la nostra experiència amb la versió d’Android. L’aplicació per a iPhone d’Otter té un aspecte gairebé idèntic a la seva contrapartida Android.

L’aplicació utilitza una interfície principalment blanca amb accent ocasional blau per posar èmfasi. Sembla net i modern, però agrairia un mode fosc. Podeu navegar per l'aplicació tocant una de les cinc icones del menú inferior: Tauler de taula, converses, registre, grups i configuració. Tanmateix, no podeu desplaçar-vos per navegar entre pantalles, i això resulta molest. panell mostra tota l'activitat del vostre compte més recent i les accions ràpides associades per a la majoria d'elements. La secció de converses mostra tots els vostres enregistraments en ordre cronològic invers. Podeu cercar termes específics dins de les transcripcions o el nom de la conversa en si. Una opció per organitzar enregistraments en carpetes seria útil, cosa que Trint ofereix.

Si feu clic a una conversa en concret, podeu veure la transcripció íntegrament juntament amb alguna informació bàsica amunt, inclosa la data, l'hora i la durada total de l'enregistrament. A la cantonada superior dreta, podeu compartir accés a la transcripció amb contactes i establir permisos d’edició. De forma alternativa, podeu compartir directament l'enllaç de només visualització que genera automàticament Otter.

Per editar una part concreta de la transcripció, simplement mantingueu-la premuda i premeu el botó Edita. Per fer modificacions, heu de tocar cada secció individualment. per exemple, no podeu desplaçar-vos a una altra secció i fer canvis en una sessió fluida. Això és una molèstia, ja que Otter no és gaire exacte amb la identificació de nous parlants o les ruptures de la conversa.

Otter també us permet editar el títol d'una transcripció, però no podeu canviar la data. Aquesta opció seria útil si haguéssiu penjat un fitxer a la interfície web (més endavant) després de la gravació original. Podeu analitzar una gravació mitjançant els controls de reproducció de la part inferior i Otter ressalta les paraules mentre reprodueix l'àudio de la transcripció. Un menú superior permet controlar la velocitat de reproducció (0, 5x-2x) o suprimir la gravació completament.

La pestanya Grups permet organitzar contactes per compartir converses fàcilment. El plantejament de Otter per compartir és una de les millors implementacions que hem vist. Altres serveis, com Rev i Trint, us permeten configurar col·laboradors o equips, però tampoc no us permeten fer-ho de manera perfecta al mòbil. La secció Configuració ofereix una alternança per restringir la càrrega i la transmissió d'àudio a una connexió Wi-Fi, juntament amb Bluetooth, emmagatzematge de dispositius i opcions de notificació. També podeu entrenar Otter per reconèixer la vostra veu, gestionar comptes connectats i accedir a una sèrie d’opcions d’assistència. Aquest procés comporta la gravació de la lectura de text de manera que es pugui obtenir un bon coneixement del model de veu.

Ràdio a la web

La interfície web d’Otter presenta el mateix estil de disseny modern i net que les seves aplicacions mòbils, tot i que també es pot beneficiar d’un mode fosc. Al llarg del carril esquerre, hi ha dos elements del menú principal: les converses i els grups. Més avall, Otter ara ofereix una secció Configuració del compte, des d’on podeu editar informació bàsica del perfil, enllaçar el vostre compte de Google o Zoom o actualitzar el nivell de comptes premium. Quan vaig revisar Otter per primera vegada, la interfície web va canviar algunes vegades durant el període de prova, però el disseny ja està més finalitzat. Per exemple, la barra de cerca de primer nivell està de tornada, que permet als usuaris cercar termes a tots els enregistraments. Les presentacions de rendiment que havia trobat anteriorment tampoc no eren proves.

La secció de converses funciona de la mateixa manera que ho fa al mòbil; enumera tots els vostres enregistraments en ordre cronològic invers. Seleccionant un fitxer obre una vista completa de la transcripció juntament amb els controls de reproducció. A partir d’aquí, podeu compartir la transcripció, exportar l’àudio o el text, tornar a executar la concordança d’altaveus o esborrar la transcripció completament.

A la part superior, podeu cercar termes complets dins de la transcripció. De forma alternativa, Otter genera una sèrie de termes comuns en la transcripció sota el títol, a la qual podeu fer clic per cercar instàncies del text. Otter inclou controls de reproducció a la part inferior, completats amb un botó de reproducció / pausa i opcions de velocitat de reproducció. Podeu examinar-vos el fitxer amb el control lliscant inclòs, però Otter no inclou botons de rebobinatge ràpid ni cap endavant. Altres serveis com Rev també inclouen funcions de ressaltat i de guies per a una edició més enfocada.

Per editar el text, simplement feu clic a la icona de llapis a la dreta de cada secció. En comptes de deixar-lo editar tot alhora, Otter requereix que feu clic a cada secció abans de fer cap canvi, cosa que alenteix el flux de treball considerablement.

Otter també us permet canviar els ID d’altaveus per blocs de text individuals. Malauradament, Otter no és fantàstic a l’hora de separar seccions per si soles; sovint divideix paràgrafs en llocs estranys. Dit això, Otter té algunes funcions hàbils. Per exemple, un cop afegiu un ID d’altaveu a una secció, passa automàticament per la resta de la transcripció i afegeix aquest nom als paràgrafs que detecti que tenen el mateix altaveu. Utilitza la mateixa informació per identificar la mateixa persona en qualsevol altra conversa o enregistrament que tingui lloc al vostre compte, tot i que aquesta funció només ha funcionat parcialment en proves.

Precisió

Per provar la precisió dels serveis de transcripció, he penjat la mateixa gravació de 16 minuts a cadascun. La gravació original d'una trucada en conferència de tres persones prové d'una gravadora de veu dedicada a l'Olympus VN-722PC. No és una gravació fàcil, però totes les veus són clarament audibles. Tot i que aquest no és l’objectiu principal d’Otter, és la millor manera de comparar el seu motor ASR directament amb el d’altres serveis.

Otter va acabar el procés de transcripció en uns sis minuts. Tots els serveis de transcripció automatitzada van completar la tasca en un rang de tres a quatre minuts. La transcripció més ràpida basada en humans, Rev, només necessita aproximadament una hora per a la mateixa tasca.

En lloc de comparar la totalitat de cada transcripció, he triat tres paràgrafs, un de cada orador de la trucada. Per a cada fragment de la transcripció, he marcat un error allà on faltava una paraula o una paraula addicional. Vaig calcular la taxa d’error general dividint el nombre total d’errors en el nombre total de paraules entre les seccions combinades (en aquest cas, 201 paraules). La mostra de la secció A és una secció introductòria breu. La secció B és una mica més llarga i utilitza vocabulari més complex. La secció C és encara més llarga i conté un llenguatge tècnic.

Otter va produir excel·lents resultats per a un servei automàtic (només tenia un índex d’error del 17 per cent), però encara no es trobava al marge del servei basat en humans que vaig provar. Per a la seva comparació, Rev només tenia una taxa d’error del 3 per cent i Scribie va convertir una còpia final amb un 6 per cent. Feu un cop d'ull al gràfic complet següent per veure el desglossament complet.

Vaig tornar a provar tots els serveis automàtics, inclòs Otter, amb una gravació més senzilla (dues persones, en persona) i vaig calcular la taxa d’error, de la mateixa manera, utilitzant dues mostres, en lloc de tres. Els serveis automàtics van sortir millor amb aquesta tasca en general, però no eren perfectes. La llúdria va caure a la meitat del grup amb un índex d’error del 21 per cent, tot i que això no estava gaire lluny del 14 per cent de Trint o del 20 per cent de Temi. A continuació, es mostren els resultats complets de la segona prova.

Xerrada i transcripció

En qualsevol lloc i quan tingueu una conversa important, haureu d’enregistrar-la i convertir-la en dades de text utilitzables. El focus d’Otter en les transcripcions i compartició en temps real la converteixen en una opció innovadora a l’espai. És més acurada que qualsevol servei de transcripció automàtica que vam provar, fins i tot si no pot competir amb els serveis basats en humans. Després d'algunes iteracions, Otter podria ser un líder de la categoria, però, de moment, us recomanem que utilitzeu Editors 'Choice Rev per a transcripcions assequibles i precises.

Revisió i valoració de la llarga