Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine

Ak hľadáte nejaký softvér do PC prípadne ak s ním máte nejaký problém.

Moderátori: psichac, Moderátori

hardstano
Okoloidúci
Okoloidúci
Príspevky: 24
Dátum registrácie: 16 Dec 2020, 11:15

Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine

Príspevok od používateľa hardstano » 29 Júl 2021, 16:57

Data sa dajú už stiahnuť a su voľne k dispozíci...
https://commonvoice.mozilla.org/sk/datasets
:potlesk:
Takže hurá na trénovanie slovenskej AI. :D
0

Používateľov profilový obrázok
boraicho
Ultimate člen
Ultimate člen
Príspevky: 12406
Dátum registrácie: 03 Feb 2007, 00:00
Bydlisko: Prešov
Vek: 35
Kontaktovať používateľa:

Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine

Príspevok od používateľa boraicho » 29 Júl 2021, 22:27

ospravedlnujem sa za blbu otazku, ale ako to funguje? alebo ako to použiť? Kde strčim ten subor?
Rasbery alebo niečo podobne, pripojim mikrofon a ono to potom dokaže prekladať hlasove príkazy do textu a všetko OFFLINE?
0
"Aj nevinne vyzerajúca súčiastka, môže byť príčinou nefunkčnosti zariadenia a tou kondenzator 100% je"
3D REBEL II + PLA + PETG
CNC 1810 na DPS

hardstano
Okoloidúci
Okoloidúci
Príspevky: 24
Dátum registrácie: 16 Dec 2020, 11:15

Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine

Príspevok od používateľa hardstano » 30 Júl 2021, 07:07

Ak je to popis blokového HW schématu, tak ano je to v podstate tak. Podstatné na tom riešení je ale to off-line :biggrin: .

Ta malina nemusí byť jediné HW riešenie viz. staršie príspevky, alebo inšpirácia z malého porovnávania HW.
https://www.hackster.io/dmitrywat/offli ... ker-c537e7

Je potrebné tam mať eště v tej maline nejaký SW na prevod hlasu do textu (STT-speech to text) napríklad DeepSpeech.
Tu je návod na inštaláciu na Raspberry Pi 4
https://github.com/touchgadget/DeepSpeech
Manuál k DeepSpeech.
https://deepspeech.readthedocs.io/en/latest/

Ďalšie informácie o prevode hlasu na text hľadať v kombináciach STT-speech to text-speech-voice-speak + Raspberry :wink:

Existuje i varianta využitia opačná a to prevod textu na hlas tj. TTS-text to speech. :)
https://levelup.gitconnected.com/instal ... af16459ab9
https://github.com/mozilla/TTS

DOVOLÍM SI POZNÁMKU, TYCH SLOVENSKÝCH DÁT VO ZVEREJNENOM BALÍKU NA STIAHNUTIE JE STRAŠNE MÁLO NA NEJAKÉ ZLOŽITEJŠIE ÚLOHY!

Celkom je teraz k dispozícii cca 6-7000 "viet" a v prípade slovenčiny to sú z 90% len samostatné slová. :(
Nahovorených je celkom 12 hodín z toho validovaných len 10 hodín. Je to tak-tak na nejaké jednoduché príkazy, to sa uvidí...

Takže prispievajte, šírte informácie, pritiahnite ďalších dobrovoľníkov, teraz keď už je slovenčina vonku, treba to už "len" rozširovať a zlepšovať... darovaním:
- textov s licenciou CC0 https://commonvoice.mozilla.org/sentence-collector/, alebo validovaním tych z wikipedie https://discourse.mozilla.org/t/slovak- ... a/71350/11
- hlasu (hovorte)
- ucha (počúvajte)
0

hardstano
Okoloidúci
Okoloidúci
Príspevky: 24
Dátum registrácie: 16 Dec 2020, 11:15

Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine

Príspevok od používateľa hardstano » 20 Feb 2022, 10:07

Bol vydaný nový hlasový dataset a slovenčina má už celkovo 17 hodín overených záznamov voľne k použitiu.
https://commonvoice.mozilla.org/sk/datasets
0

hardstano
Okoloidúci
Okoloidúci
Príspevky: 24
Dátum registrácie: 16 Dec 2020, 11:15

Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine

Príspevok od používateľa hardstano » 02 Sep 2022, 19:09

V lete bol vydaný aktualizovaný dataset. Slovenčina nezaznamenala výrazný pokrok a pribudla len 1 hodina a tak má iba 18 hodín overených záznamov.

Chce to nové hlasové záznamy a trochu viac zaparacovať hlavně na pridávaní a kontrole nového obsahu tu:
https://commonvoice.mozilla.org/sentenc ... ctor/#/sk/
0

Napísať odpoveď
  • Podobné témy
    Odpovedí
    Zobrazení
    Posledný príspevok