Vox imperium in PC et RaspberryPi cum Whisper

vox imperium in pc et amet pi

Rationem consilii vocem mandatis dare ut penitus per nostram PC vel nostrum Raspberry Pi utens voce-ad-textum Susurro exemplar.

Mandatum dabimus ut transcribatur, ad textum convertatur, cum Whisper et deinde enucleetur ad exsequendum ordinem convenientem, qui potest esse a programmate faciendi intentionem ad RaspberryPi fibulas danda.

Utitur vetus Raspberry Pi 2, micro USB et utar exemplar vocis vocis ad textum nuper ab OpenAI emissum, vix parvam stillam. In fine articulum videre potes paulo plus susurri.

Omnes programmatibus Python.

Ostensionem tibi relinquo quomodo in hoc video operetur, PC voce moderans.

orantibus escendere suggestum

Utamur cum PC, tortor ligula nisi eget.

Si eam in RaspberryPi conscendere properas, USB tortori opus erit, quia sincipulum tantum pro output habet.

Nos postulo:

Finis generalis instrumenti est vox cognitionis. Perutile invenio eam in operatione aliarum machinis integrare.

  • Micro-USB
  • RUBUS IDAEUS PI cum operating ratio (Raspbian pro example)
  • Electronics (LED, filis, 480 olim resistor et breadboard)

17 Ductum ad clavum coniungimus, quod unum est quod nos ad hanc experientiam excitabimus et deactivate.

codice progressus

Dividitur in partes tres geeksforgeeksego enim illos libros nescio. Secunda, conversio auditionis ad textum cum Whisper et tertia, tractatio illius textus et responsio in RaspberryPi

In exemplo probato solum sum ad mutuam cum Duce, faciens illum vel ictu vel lucere, sed scripturam evolvere potuimus ad necessitates nostras accommodare.

Scio hoc esse Raspberry Pi 2 et multo tardius futurum esse quam RUBUS IDAEUS Pi 4, sed bene probatum est.

Priusquam opus facere possis, necesse est sequentia instituere

#Instalar whisper
pip install git+https://github.com/openai/whisper.git
sudo apt update && sudo apt install ffmpeg

#para que funcione la grabación de audio
python3 -m pip install sounddevice --user
pip install git+https://github.com/WarrenWeckesser/wavio.git

#si vas a instalarlo en la raspberry
#dar permisos para usar la GPIO
sudo apt install python3-gpiozero
sudo usermode -aG gpio <username>

omnes codice

#!/usr/bin/env python3
import whisper
import time
from gpiozero import LED
import sounddevice as sd
from scipy.io.wavfile import write
import wavio as wv

        
def main ():
    inicio = time.time()
    record_audio ()

    model = whisper.load_model("tiny")
    result = model.transcribe("audio1.wav")
    words = result["text"].split()

    for word in words:
        word = word.replace(',', '').replace('.', '').lower()
        if word == 'enciende' or 'encender':
            encender()
            break
        if word == 'parpadea' or 'parpadear':
            parpadear()
            break      
    fin = time.time()
    print(fin-inicio)

def encender ():
    LED(17).on()

def parpadear ():
    light = LED(17)
    while True:
        light.on()
        sleep(1)
        light.off()
        sleep(1)

def record_audio ():
    # Sampling frequency
    freq = 44100
    # Recording duration
    duration = 5
    # Start recorder with the given values
    # of duration and sample frequency
    recording = sd.rec(int(duration * freq),
                    samplerate=freq, channels=2)
    # Record audio for the given number of seconds
    sd.wait()
    # This will convert the NumPy array to an audio
    # file with the given sampling frequency
    write("audio0.wav", freq, recording)
    # Convert the NumPy array to audio file
    wv.write("audio1.wav", recording, freq, sampwidth=2)
        
main ()


#dar permisos para usar la GPIO
#sudo apt install python3-gpiozero
#sudo usermode -aG gpio <username>

#Instalar whisper
#pip install git+https://github.com/openai/whisper.git
#sudo apt update &amp;&amp; sudo apt install ffmpeg

Id probare non potui, quia RaspberryPi microSD non habeo, vel oratorem USB connectere, sed quamprimum errorem aliquem corrigere conor quod facile labi est.

Gradatim explicatio in codice

#!/usr/bin/env python3

Shebang ad indicandam machinam qua lingua in programmatis et quo interprete utatur. Tametsi frivola videtur, non multis occasionibus errata ponens.

importari libraries

import whisper
import time
from gpiozero import LED
import sounddevice as sd
from scipy.io.wavfile import write
import wavio as wv

Susurro ad exemplar opus

tempus, quia usus est ad temperandum tempus illud exsequendi scriptionem, gpiozero ad operandum cum GPIO paxillos de Raspberry et sounddevice, scipy et wavio ad recordandum audio

munera

4 munera creavi;

  • principalis ()
  • lux ()
  • ictu ()
  • record_audio()

verto () simpliciter dat intentionem ad 17 de RUBUS IDABILIS ubi conexi sumus in hoc casu ductus ad probandum.

def encender ():
    LED(17).on()

ictu() similis est () sed ictu ductus efficit ut interdum in ansam convertat.

def parpadear ():
    light = LED(17)
    while True:
        light.on()
        sleep(1)
        light.off()
        sleep(1)

Cum record_audio() memoramus tabellam audio

def record_audio ():
    # Sampling frequency
    freq = 44100
    # Recording duration
    duration = 5
    # Start recorder with the given values
    # of duration and sample frequency
    recording = sd.rec(int(duration * freq),
                    samplerate=freq, channels=2)
    # Record audio for the given number of seconds
    sd.wait()
    # This will convert the NumPy array to an audio
    # file with the given sampling frequency
    write("audio0.wav", freq, recording)
    # Convert the NumPy array to audio file
    wv.write("audio1.wav", recording, freq, sampwidth=2)

Praecipuum munus praecipuum est, vide solum rem quam extra functiones habemus vocationem ad principale () in fine scripturae. Hoc modo in startup, bibliothecas importabit et tunc munus vocationis faciet.

def main ():
    inicio = time.time()
    record_audio ()

    model = whisper.load_model("tiny")
    result = model.transcribe("audio1.wav")
    words = result["text"].split()

    for word in words:
        word = word.replace(',', '').replace('.', '').lower()
        if word == 'enciende' or 'encender':
            encender()
            break
        if word == 'parpadea' or 'parpadear':
            parpadear()
            break      
    fin = time.time()
    print(fin-inicio)

Tempus servamus quo munus exsequi incipimus et tunc munus auditionis recordationis appellamus quod instructionem nostram in tabula .mp3, etc.

    inicio = time.time()
    record_audio ()

  

Cum nos audimus, susurrus vocabitur et narramus, quo exemplo volumus uti, sunt 5 in promptu, et utemur pusillo, licet certissimum sit, quod est celerrimus, et quod audio simplex erit; tantum III aut IV verba.

     model = whisper.load_model("tiny")
    result = model.transcribe("audio1.wav")

  

Cum hoc habemus auditum in textu conversi et variabili servatum. Modum faciamus.

Eventum in album convertimus cum singulis auditionis verbis

     words = result["text"].split()

  

Et omnia parata sunt ad nostram machinam penitus. Nunc solum habemus condiciones quas volumus creare.

Si audio verbum X habet, Y. Cum verba in indice habemus, condiciones addere perfacile est

         for word in words:
        word = word.replace(',', '').replace('.', '').lower()
        if word == 'enciende' or 'encender':
            encender()
            break
        if word == 'parpadea' or 'parpadear':
            parpadear()
            break   

  

et rectam

         
        word = word.replace(',', '').replace('.', '').lower()


  

Eo uti verba in audio ad lowercase convertere et commata temporaque removere. Et hoc modo vitare errores in comparationibus

In unoquoque, si conditio habendi aliquorum verborum quos eligimus occurrit, munus vocat id quod velimus facturum;

Hoc est ubi indicamus illud movere PIN qui ducitur vel accendet vel ictu faciet. Aut codicem aliquem currere, aut computatorium claude.

Haec tota idea fundamentalis est. Hinc evolvere potes et emendare ut vis. Quisque homo alium usum sibi invenire potest.

Rerum hoc facere possumus montage

Hae sunt notiones quae ad me veniunt uti montage isto. Ossa cum armata sunt, ea uti possumus omnia quae voce in mentem veniunt movere, nullam movere possumus quae motor incipit vel scriptionem facere possumus quae scriptionem, vel electronicam vel quicquid exsequitur.

Quod susurro

Susurri vol agnitio exemplar est, opera in multiloquio cum multis linguis et translatione in Anglicam concedit. Quod scimus ut instrumentum vocis scripti ab OpenAI team, creatorum Dall-e, dimissum est.

Deja un comentario