Runas atpazīšana, izmantojot Google runas API un Python: 4 soļi

Satura rādītājs:

1. darbība. ReSpeaker USB 4-Mic Array
2. darbība: instalējiet nepieciešamās bibliotēkas
3. darbība. Teksta pārvēršana runā Python, izmantojot Pyttsx3 bibliotēku
4. solis: apvienojiet visu: izveidojiet runas atpazīšanu, izmantojot Python, izmantojot Google runas atpazīšanas API un Pyttsx3 bibliotēku

2025 Autors: John Day | [email protected]. Pēdējoreiz modificēts: 2025-01-23 14:59

Runas atpazīšana

Runas atpazīšana ir daļa no dabiskās valodas apstrādes, kas ir mākslīgā intelekta apakšnozare. Vienkārši sakot, runas atpazīšana ir datora programmatūras spēja noteikt vārdus un frāzes runātajā valodā un pārvērst tos par cilvēkiem lasāmu tekstu. To izmanto vairākās lietojumprogrammās, piemēram, balss palīgu sistēmās, mājas automatizācijā, balss tērzēšanas robotos, balss mijiedarbojošos robotos, mākslīgajā intelektā utt.

Runas atpazīšanai ir dažādas API (lietojumprogrammu programmēšanas saskarne). Tie piedāvā bezmaksas vai maksas pakalpojumus. Šie ir:

CMU Sfinksa
Google runas atpazīšana
Google Cloud Speech API
Wit.ai
Microsoft Bing balss atpazīšana
Houndify API
IBM runas teksts
Sniega puiša karsto vārdu noteikšana

Šeit mēs izmantosim Google runas atpazīšanu, jo tai nav nepieciešama API atslēga. Šīs apmācības mērķis ir sniegt ievadu par to, kā lietot Google runas atpazīšanas bibliotēku Python, izmantojot ārēju mikrofonu, piemēram, ReSpeaker USB 4-Mic Array no Seeed Studio. Lai gan ārējā mikrofona izmantošana nav obligāta, var izmantot pat klēpjdatora iebūvēto mikrofonu.

1. darbība. ReSpeaker USB 4-Mic Array

ReSpeaker USB Mic ir četrmikrofonu ierīce, kas paredzēta AI un balss lietojumprogrammām, un to izstrādāja Seeed Studio. Tam ir 4 augstas veiktspējas iebūvēti daudzvirzienu mikrofoni, kas paredzēti balss uztveršanai no jebkuras vietas telpā, un 12 programmējami RGB LED indikatori. ReSpeaker USB mikrofons atbalsta Linux, macOS un Windows operētājsistēmas. Sīkāka informācija atrodama šeit.

ReSpeaker USB mikrofons ir iekļauts jaukā iepakojumā, kurā ir šādi priekšmeti:

Lietotāja rokasgrāmata
ReSpeaker USB mikrofona masīvs
Mikro USB uz USB kabeli

Tāpēc mēs esam gatavi sākt.

2. darbība: instalējiet nepieciešamās bibliotēkas

Šajā apmācībā es pieņemu, ka izmantojat Python 3.x.

Instalēsim bibliotēkas:

pip3 instalēt SpeechRecognition

Operētājsistēmā macOS vispirms instalējiet PortAudio ar Homebrew un pēc tam instalējiet PyAudio ar pip3:

brūvēt instalēt portaudio

Mēs izpildām komandu zemāk, lai instalētu pyaudio

pip3 instalējiet pyaudio

Linux gadījumā PyAudio var instalēt ar apt:

sudo apt-get instalēt python-pyaudio python3-pyaudio

Operētājsistēmai Windows PyAudio var instalēt ar pip:

pip instalēt pyaudio

Izveidojiet jaunu python failu

nano get_index.py

Ielīmējiet uz get_index.py zem koda fragmenta:

importēt pyaudio

p = pyaudio. PyAudio () info = p.get_host_api_info_by_index (0) numdevices = info.get ('deviceCount') i diapazonā (0, numdevices): ja (p.get_device_info_by_host_api_device_index (0, i).get ('maxInput '))> 0: print ("Ievades ierīces ID", i, " -", p.get_device_info_by_host_api_device_index (0, i).get (' nosaukums '))

Palaidiet šādu komandu:

python3 get_index.py

Manā gadījumā komanda ekrānā dod šādu izvadi:

Ievades ierīces ID 1 - ReSpeaker 4 Mic Array (UAC1.0)

Ievades ierīces ID 2 - MacBook Air mikrofons

Mainiet device_index uz indeksa numuru pēc jūsu izvēles zemāk esošajā koda fragmentā.

importēt runas atpazīšanu kā sr

r = s. Recognizer () runa = sr. Mikrofons (device_index = 1) ar runu kā avotu: drukāt ("pateikt kaut ko! …") audio = r.adjust_for_ambient_noise (avots) audio = r.listen (avots) mēģināt: recog = r.recognize_google (audio, language = 'lv-ASV') print ("Jūs teicāt:" + recog), izņemot sr. UnknownValueError: print ("Google runas atpazīšana nevarēja saprast audio"), izņemot sr. RequestError kā e: print ("Nevarēja pieprasīt rezultātus no Google runas atpazīšanas pakalpojuma; {0}". Formāts (e))

Ierīces indekss tika izvēlēts 1, jo ReSpeaker 4 Mic Array būs galvenais avots.

3. darbība. Teksta pārvēršana runā Python, izmantojot Pyttsx3 bibliotēku

Ir pieejamas vairākas API, lai python pārvērstu tekstu runā. Viena no šādām API ir pyttsx3, kas, manuprāt, ir labākā pieejamā teksta-runas pakotne. Šī pakotne darbojas operētājsistēmās Windows, Mac un Linux. Pārbaudiet oficiālo dokumentāciju, lai redzētu, kā tas tiek darīts.

Instalējiet paketi Izmantojiet pip, lai instalētu paketi.

pip instalēt pyttsx3

Ja izmantojat sistēmu Windows, jums būs nepieciešama papildu pakotne pypiwin32, kas tai būs nepieciešama, lai piekļūtu vietējai Windows runas API.

pip instalējiet pypiwin32

Teksta pārvēršana runas python skriptā Zemāk ir koda fragments tekstam runā, izmantojot pyttsx3:

importēt pyttsx3

dzinējs = pyttsx3.init ()

engine.setProperty ('likme', 150) # Ātruma procenti

engine.setProperty ('tilpums', 0,9) # Sējums 0-1

engine.say ("Sveika, pasaule!")

engine.runAndWait ()

4. solis: apvienojiet visu: izveidojiet runas atpazīšanu, izmantojot Python, izmantojot Google runas atpazīšanas API un Pyttsx3 bibliotēku

Zemāk esošais kods ir atbildīgs par cilvēka runas atpazīšanu, izmantojot Google runas atpazīšanu, un teksta pārvēršanu runā, izmantojot pyttsx3 bibliotēku.

importēt runas atpazīšanu kā sr

importēt pyttsx3 motoru = pyttsx3.init () engine.setProperty ('likme', 200) engine.setProperty ('tilpums', 0,9) r = sr.: audio = r.adjust_for_ambient_noise (avots) audio = r.listen (avots) try: recog = r.recognize_google (audio, language = 'en-US') print ("Jūs teicāt:" + recog) engine.say (" Jūs teicāt: " + recog) engine.runAndWait () izņemot sr. UnknownValueError: engine.say (" Google runas atpazīšana nevarēja saprast audio ") engine.runAndWait () izņemot sr. RequestError kā e: engine.say (" Nevarēja pieprasīt rezultātus no Google runas atpazīšanas pakalpojuma; {0} ". format (e)) engine.runAndWait ()

Tas izdrukā izvadi terminālī. Turklāt tas tiks pārvērsts arī runā.

Jūs teicāt: Londona ir Lielbritānijas galvaspilsēta

Es ceru, ka jums tagad ir labāka izpratne par runas atpazīšanas darbību kopumā un, pats galvenais, kā to ieviest, izmantojot Google runas atpazīšanas API kopā ar Python.

Ja jums ir kādi jautājumi vai atsauksmes? Atstājiet komentāru zemāk. Sekojiet līdzi!

Ieteicams:

Mākslīgais intelekts un attēlu atpazīšana, izmantojot HuskyLens: 6 soļi (ar attēliem)

Mākslīgais intelekts un attēlu atpazīšana, izmantojot HuskyLens: Hei, kas notiek, puiši! Akarsh šeit no CETech. Šajā projektā mēs apskatīsim HuskyLens no DFRobot. Tas ir ar AI darbināms kameras modulis, kas spēj veikt vairākas mākslīgā intelekta darbības, piemēram, sejas atpazīšanu

Runas atpazīšana ar Arduino (Bluetooth + LCD + Android): 6 soļi

Runas atpazīšana ar Arduino (Bluetooth + LCD + Android): Šajā projektā mēs veiksim runas atpazīšanu ar Arduino, Bluetooth moduli (HC-05) un LCD. izveidosim savu runas atpazīšanas ierīci

Ierīces atpazīšana reāllaikā, izmantojot EM pēdas: 6 soļi

Ierīces atpazīšana reāllaikā, izmantojot EM pēdas: Šī ierīce ir paredzēta dažādu elektronisko ierīču klasificēšanai pēc to EM signāliem. Dažādām ierīcēm tās izstaro dažādus EM signālus. Mēs esam izstrādājuši IoT risinājumu, lai identificētu elektroniskās ierīces, izmantojot daļiņu

Zvaigžņu atpazīšana, izmantojot datora redzi (OpenCV): 11 soļi (ar attēliem)

Zvaigžņu atpazīšana, izmantojot datoru redzi (OpenCV): šajā pamācībā tiks aprakstīts, kā izveidot datora redzes programmu, lai attēlā automātiski identificētu zvaigžņu rakstus. Metode izmanto OpenCV (Open-Source Computer Vision) bibliotēku, lai izveidotu apmācītu HAAR kaskāžu kopumu, kas var būt

Sejas atpazīšana un identifikācija - Arduino sejas ID, izmantojot OpenCV Python un Arduino .: 6 soļi

Sejas atpazīšana un identifikācija | Arduino sejas ID, izmantojot OpenCV Python un Arduino .: Sejas atpazīšana AKA sejas ID ir viena no svarīgākajām mūsdienu mobilo tālruņu funkcijām. Tātad, man radās jautājums " vai man var būt sejas ID savam Arduino projektam " un atbilde ir jā … Mans ceļojums sākās šādi: 1. solis: piekļuve mums

Runas atpazīšana, izmantojot Google runas API un Python: 4 soļi

Satura rādītājs:

Runas atpazīšana

1. darbība. ReSpeaker USB 4-Mic Array

2. darbība: instalējiet nepieciešamās bibliotēkas

3. darbība. Teksta pārvēršana runā Python, izmantojot Pyttsx3 bibliotēku

4. solis: apvienojiet visu: izveidojiet runas atpazīšanu, izmantojot Python, izmantojot Google runas atpazīšanas API un Pyttsx3 bibliotēku

Ieteicams:

Mākslīgais intelekts un attēlu atpazīšana, izmantojot HuskyLens: 6 soļi (ar attēliem)

Runas atpazīšana ar Arduino (Bluetooth + LCD + Android): 6 soļi

Ierīces atpazīšana reāllaikā, izmantojot EM pēdas: 6 soļi

Zvaigžņu atpazīšana, izmantojot datora redzi (OpenCV): 11 soļi (ar attēliem)

Sejas atpazīšana un identifikācija - Arduino sejas ID, izmantojot OpenCV Python un Arduino .: 6 soļi

Ultrasmall Ultrastable DIY UHF spiegu kļūda: 6 soļi

Arduino kā lēts maizes dēlis FPGA: 5 soļi (ar attēliem)

HAL 9000, SAL 9000 Alexa Pi hibrīds: 4 soļi (ar attēliem)

PC kāju pedāļi: 7 soļi

RpiGarageDoorDistanceSensor: 6 soļi (ar attēliem)

Augsnes mitruma mērīšana ar Arduino: 6 soļi

NLDWRTG ULTIMATE WRT54G paplašināšanas panelis: 8 soļi (ar attēliem)

Daļas glābšanai no DVD/CD atskaņotāja: 10 soļi

OrangeBOX: uz OrangePI balstīta drošas dublēšanas krātuves ierīce: 5 soļi

Temperatūras un mitruma datu reģistrētājs no Arduino uz Android tālruni ar SD kartes moduli, izmantojot Bluetooth: 5 soļi

Temperatūras sensors DS18B20 (Raspberry Pi): 4 soļi (ar attēliem)

DIP melodijas selektors, izmantojot 1 tapu: 4 soļi

Gledopto: lēta Philips Hue gaismas sloksnes alternatīva: 3 soļi

Digitālais temperatūras sensors uz Arduino bāzes: 5 soļi (ar attēliem)

1. projekts Weatheron: 6 soļi

Valentīna vāzes žilbinātājs: 8 soļi (ar attēliem)