Rationem consilii vocem mandatis dare ut penitus per nostram PC vel nostrum Raspberry Pi utens voce-ad-textum Susurro exemplar.
Mandatum dabimus ut transcribatur, ad textum convertatur, cum Whisper et deinde enucleetur ad exsequendum ordinem convenientem, qui potest esse a programmate faciendi intentionem ad RaspberryPi fibulas danda.
Utitur vetus Raspberry Pi 2, micro USB et utar exemplar vocis vocis ad textum nuper ab OpenAI emissum, vix parvam stillam. In fine articulum videre potes paulo plus susurri.
Omnes programmatibus Python.
Ostensionem tibi relinquo quomodo in hoc video operetur, PC voce moderans.
orantibus escendere suggestum
Utamur cum PC, tortor ligula nisi eget.
Si eam in RaspberryPi conscendere properas, USB tortori opus erit, quia sincipulum tantum pro output habet.
Nos postulo:
Finis generalis instrumenti est vox cognitionis. Perutile invenio eam in operatione aliarum machinis integrare.
- Micro-USB
- RUBUS IDAEUS PI cum operating ratio (Raspbian pro example)
- Electronics (LED, filis, 480 olim resistor et breadboard)
17 Ductum ad clavum coniungimus, quod unum est quod nos ad hanc experientiam excitabimus et deactivate.
codice progressus
Dividitur in partes tres geeksforgeeksego enim illos libros nescio. Secunda, conversio auditionis ad textum cum Whisper et tertia, tractatio illius textus et responsio in RaspberryPi
In exemplo probato solum sum ad mutuam cum Duce, faciens illum vel ictu vel lucere, sed scripturam evolvere potuimus ad necessitates nostras accommodare.
Scio hoc esse Raspberry Pi 2 et multo tardius futurum esse quam RUBUS IDAEUS Pi 4, sed bene probatum est.
Priusquam opus facere possis, necesse est sequentia instituere
#Instalar whisper pip install git+https://github.com/openai/whisper.git sudo apt update && sudo apt install ffmpeg #para que funcione la grabación de audio python3 -m pip install sounddevice --user pip install git+https://github.com/WarrenWeckesser/wavio.git #si vas a instalarlo en la raspberry #dar permisos para usar la GPIO sudo apt install python3-gpiozero sudo usermode -aG gpio <username>
omnes codice
#!/usr/bin/env python3 import whisper import time from gpiozero import LED import sounddevice as sd from scipy.io.wavfile import write import wavio as wv def main (): inicio = time.time() record_audio () model = whisper.load_model("tiny") result = model.transcribe("audio1.wav") words = result["text"].split() for word in words: word = word.replace(',', '').replace('.', '').lower() if word == 'enciende' or 'encender': encender() break if word == 'parpadea' or 'parpadear': parpadear() break fin = time.time() print(fin-inicio) def encender (): LED(17).on() def parpadear (): light = LED(17) while True: light.on() sleep(1) light.off() sleep(1) def record_audio (): # Sampling frequency freq = 44100 # Recording duration duration = 5 # Start recorder with the given values # of duration and sample frequency recording = sd.rec(int(duration * freq), samplerate=freq, channels=2) # Record audio for the given number of seconds sd.wait() # This will convert the NumPy array to an audio # file with the given sampling frequency write("audio0.wav", freq, recording) # Convert the NumPy array to audio file wv.write("audio1.wav", recording, freq, sampwidth=2) main () #dar permisos para usar la GPIO #sudo apt install python3-gpiozero #sudo usermode -aG gpio <username> #Instalar whisper #pip install git+https://github.com/openai/whisper.git #sudo apt update && sudo apt install ffmpeg
Id probare non potui, quia RaspberryPi microSD non habeo, vel oratorem USB connectere, sed quamprimum errorem aliquem corrigere conor quod facile labi est.
Gradatim explicatio in codice
#!/usr/bin/env python3
Shebang ad indicandam machinam qua lingua in programmatis et quo interprete utatur. Tametsi frivola videtur, non multis occasionibus errata ponens.
importari libraries
import whisper import time from gpiozero import LED import sounddevice as sd from scipy.io.wavfile import write import wavio as wv
Susurro ad exemplar opus
tempus, quia usus est ad temperandum tempus illud exsequendi scriptionem, gpiozero ad operandum cum GPIO paxillos de Raspberry et sounddevice, scipy et wavio ad recordandum audio
munera
4 munera creavi;
- principalis ()
- lux ()
- ictu ()
- record_audio()
verto () simpliciter dat intentionem ad 17 de RUBUS IDABILIS ubi conexi sumus in hoc casu ductus ad probandum.
def encender (): LED(17).on()
ictu() similis est () sed ictu ductus efficit ut interdum in ansam convertat.
def parpadear (): light = LED(17) while True: light.on() sleep(1) light.off() sleep(1)
Cum record_audio() memoramus tabellam audio
def record_audio (): # Sampling frequency freq = 44100 # Recording duration duration = 5 # Start recorder with the given values # of duration and sample frequency recording = sd.rec(int(duration * freq), samplerate=freq, channels=2) # Record audio for the given number of seconds sd.wait() # This will convert the NumPy array to an audio # file with the given sampling frequency write("audio0.wav", freq, recording) # Convert the NumPy array to audio file wv.write("audio1.wav", recording, freq, sampwidth=2)
Praecipuum munus praecipuum est, vide solum rem quam extra functiones habemus vocationem ad principale () in fine scripturae. Hoc modo in startup, bibliothecas importabit et tunc munus vocationis faciet.
def main (): inicio = time.time() record_audio () model = whisper.load_model("tiny") result = model.transcribe("audio1.wav") words = result["text"].split() for word in words: word = word.replace(',', '').replace('.', '').lower() if word == 'enciende' or 'encender': encender() break if word == 'parpadea' or 'parpadear': parpadear() break fin = time.time() print(fin-inicio)
Tempus servamus quo munus exsequi incipimus et tunc munus auditionis recordationis appellamus quod instructionem nostram in tabula .mp3, etc.
inicio = time.time() record_audio ()
Cum nos audimus, susurrus vocabitur et narramus, quo exemplo volumus uti, sunt 5 in promptu, et utemur pusillo, licet certissimum sit, quod est celerrimus, et quod audio simplex erit; tantum III aut IV verba.
model = whisper.load_model("tiny") result = model.transcribe("audio1.wav")
Cum hoc habemus auditum in textu conversi et variabili servatum. Modum faciamus.
Eventum in album convertimus cum singulis auditionis verbis
words = result["text"].split()
Et omnia parata sunt ad nostram machinam penitus. Nunc solum habemus condiciones quas volumus creare.
Si audio verbum X habet, Y. Cum verba in indice habemus, condiciones addere perfacile est
for word in words: word = word.replace(',', '').replace('.', '').lower() if word == 'enciende' or 'encender': encender() break if word == 'parpadea' or 'parpadear': parpadear() break
et rectam
word = word.replace(',', '').replace('.', '').lower()
Eo uti verba in audio ad lowercase convertere et commata temporaque removere. Et hoc modo vitare errores in comparationibus
In unoquoque, si conditio habendi aliquorum verborum quos eligimus occurrit, munus vocat id quod velimus facturum;
Hoc est ubi indicamus illud movere PIN qui ducitur vel accendet vel ictu faciet. Aut codicem aliquem currere, aut computatorium claude.
Haec tota idea fundamentalis est. Hinc evolvere potes et emendare ut vis. Quisque homo alium usum sibi invenire potest.
Rerum hoc facere possumus montage
Hae sunt notiones quae ad me veniunt uti montage isto. Ossa cum armata sunt, ea uti possumus omnia quae voce in mentem veniunt movere, nullam movere possumus quae motor incipit vel scriptionem facere possumus quae scriptionem, vel electronicam vel quicquid exsequitur.
Quod susurro
Susurri vol agnitio exemplar est, opera in multiloquio cum multis linguis et translatione in Anglicam concedit. Quod scimus ut instrumentum vocis scripti ab OpenAI team, creatorum Dall-e, dimissum est.