FS20-Sprachsensor FS20 SS – Spracherkennungs-Grundlagen Teil 2/2
Aus ELVjournal
02/2006
0 Kommentare
Technische Daten
sprachgesteuerten FS20-Kanäle | 4 |
Zweistufige Erkennung | sprecherabhängige Triggerwörter,
sprecherunabhängige Kommandos |
Kommandos | Aus, Ein, Niedrig, Mittel und Voll |
Dimmerstufen | Niedrig (38 %), Mittel (69 %), Voll (100 %) |
Default-Hauscode | 11111111 |
Default-Adresscode | 4444 |
Versorgungsspannung | 6 VDC bis 18 VDC/60 mA |
DC-Versorgungsanschluss | 3,5-mm-Klinkenstecker (Mittelkontakt = +) |
Abmessungen (Ø x H) | 110 x 63 mm |
Nachdem
im letzten „ELVjournal“ die Grundlagen der Spracherkennung am Beispiel
des Sprachprozessors RSC 4128 erläutert wurden, geht es jetzt an die
Realisierung einer Sprachsteuerung für das FS20-Funksystem.Ein UFO, das aufs Wort hört
Passend
zum Science-Fiction-Feeling, ist der FS20-Sprachsensor (FS20 SS) in
einem kleinen Tischgehäuse verpackt, das ein bisschen an ein Mini-UFO
erinnert und das von einem handelsüblichen Steckernetzteil versorgt
wird. Die akustischen Sprachkommandos werden vom eingebauten Mikrofon
umgewandelt und in den Sprachprozessor eingespeist, der die Erkennung
vornimmt und über ein Funk-Sendemodul andere Geräte des FS20-Funksystems
ansteuern kann.
|
Bild 8: Schaltbild der Spracherkennung FS20 SS |
Über
die Klinkenbuchse, die an ST 1 und ST 2 angeschlossen ist, wird der
FS20 SS von einem externen Steckernetzteil mit 6 V bis 18 V
Gleichspannung versorgt. D 1 sorgt für den Verpolungsschutz, und der
lineare Spannungsregler IC 1 mit den Kondensatoren C 1 bis C 4 erzeugt
die 3,3 V Versorgungsspannung für den Rest der Schaltung (Abbildung 8).
Der Sprachprozessor RSC 4128 (IC 4) bildet den Kern des FS20 SS, der von
einem 3,58-MHz-Quarz (Q 1) getaktet wird. R 1, D 2 und C 15 sorgen für
einen definierten Einschalt-Reset. Die Betriebs-Firmware befindet sich
im Speicher IC 2. Zur Speicherung der trainierten Wortmuster kommt ein
serielles EEPROM vom Typ 24LC16B zum Einsatz. Die einzige Bedientaste TA
1 ist direkt mit einem I/O-Pin verbunden, ein weiterer I/O-Pin schaltet
die Leuchtdiode D 3 über den Vorwiderstand R 3. Da der RSC 4128 einen
eingebauten PWM-Ausgang für eine direkte Lautsprecheransteuerung
beinhaltet, ist lediglich ein kleines RC-Netzwerk (C 10 und R 2) zur
Filterung des Ausgangssignals und zur Anpassung an den Lautsprecher
notwendig.
Das Elektretmikrofon erhält seine Betriebsspannung über ein
Filternetzwerk aus R 4, R 5, C 24 und C 25. Das durch C 23 entkoppelte
und durch D 4 und D 5 gegen eventuelle statische Entladungen geschützte
Audio-Signal wird direkt in den Mikrofoneingang des RSC 4128 geführt.
Die Kondensatoren (C 16 bis C 19) sorgen für eine saubere Pufferung der
analogen Schaltungsteile des Prozessors, die obligatorischen
100-nF-Stützkondensatoren an jedem digitalen Versorgungsspannungspin
sind besonders bei gemischten Analog- und Digitalschaltungen Pflicht.
Zur Kommunikation mit dem FS20-Funk-Schaltsystem dient schließlich das
Funk-Sendemodul HFS 1, welches direkt von einem I/O-Pin angesteuert
wird.Nachbau
Die
FS20-SS-Platine ist zum großen Teil in SMD-Technologie aufgebaut. Um
den Nachbau zu erleichtern, enthält der ELV-Bausatz eine teilbestückte
Platine, auf der alle SMD-Bauteile bereits vormontiert sind. Es müssen
also lediglich die bedrahteten Bauelemente, die Verdrahtung und der
Zusammenbau durchgeführt werden.
Die Bestückung der Bauteile erfolgt in gewohnter Weise anhand der
Stückliste und des Bestückungsdrucks auf der Platine. Bei den gepolten
Bauteilen (Elkos, LED) ist auf die richtige Einbaulage gemäß des
Bestückungsdruckes zu achten. Alle bedrahteten Teile werden auf der
Bestückungsseite der Platine montiert (das ist die Seite mit den
SMD-ICs), mit Ausnahme von drei Komponenten: der Taster, die LED und der
Anschluss des Mikrofons werden auf der Lötseite montiert, so dass Sie
beim späteren Zusammenbau nach oben in Richtung der entsprechenden
Löcher der oberen Gehäusehalbschale zeigen. Die LED wird so montiert,
dass sich die Spitze des LED-Gehäuses 13 mm oberhalb der Platine
befindet. Der Datenspeicher IC 2 (ELV05519) ist dann polungsrichtig in
den bereits aufgelöteten PLCC-Sockel zu stecken. Anschließend sind die
Leitungen für die Verdrahtung zu bestücken. Löten Sie zwei schwarze,
flexible Leitungen (Länge 100 mm) für den Lautsprecheranschluss (ST 3,
ST 4) und zwei Leitungen (Rot an ST 1, Schwarz an ST 2, Länge 110 mm)
für die Spannungsversorgung von der Unterseite in die entsprechenden
Bohrungen der Platine ein. Für den Mikrofonanschluss löten Sie die zwei
dünnen Wire-Wrap-Drähte (je 30 mm lang) von der Oberseite in die
zugehörigen Anschlüsse auf der Platine ein, so dass das Ganze so
aussieht wie in Abbildung 10.
Zum Abschluss der Bestückungsarbeiten ist das Funk-Sendemodul HFS 1 zu
montieren. Dieses wird so von der Bestückungsseite eingesetzt, dass die
Anschlusspins auf der Lötseite ca. 2 mm durchstehen. Vor dem Anlöten der
Stiftleiste sollte die waagerechte Positionierung nochmals geprüft
werden. Damit ist die Platine fertig vorbereitet, und es kann an den
Zusammenbau gehen.Gehäuseeinbau
|
Bild 9: Vorbereitetes Gehäuse- unterteil |
Zunächst
muss das Gehäuse wie folgt vorbereitet werden: Schrauben Sie die
Klinkenbuchse in den Gehäusesockel und kleben Sie die vier Gummifüße an
die markierten Stellen. Drehen Sie den Gehäusesockel in die untere
Halbschale, so dass der kleine Pfeil im Sockel genau in die Lücke der
vorderen Plastiklaschen der Halbschale zeigt (Abbildung 9).
|
Bild 10: Bestückte Platine mit angelöteten Anschlussleitungen |
In
der oberen Halbschale wird jetzt die Platine eingebaut (Abbildung 10).
Das Mikrofon ist bereits eingeklebt, so dass lediglich die
vorbereiteten Leitungen angelötet werden müssen. Da das Mikrofon gepolt
ist, ist der richtige Anschluss entsprechend der Abbildungen 11 bis 13
sehr wichtig. Wenn die Drähte angelötet sind, wird die Platine
vorsichtig so positioniert, dass Taster und LED in die entsprechenden
Löcher passen. Achten Sie dabei darauf, dass die empfindlichen
Mikrofonleitungen nicht brechen oder von den Lötstellen abreißen.
Fixieren Sie die Platine mit den vier kleinen Schrauben 2,5 x 6 mm.
Nun werden die Leitungen für Lautsprecher und Spannungsversorgung
entsprechend Abbildung 14 verdrahtet. Zum Anschluss der Klinkenbuchse
ist die rote Ader (von ST 1 kommend) an den von hinten gesehen rechten
Anschluss zu löten, die schwarze Ader (von ST 2) entsprechend an den
linken Anschluss.Als Letztes werden die Gehäuseschalen aufeinander
gelegt und zusammengedreht. Richtig eingesetzt lassen sich beide Teile
leicht ineinander legen und durch Verdrehen einrasten. Achten Sie
darauf, dass die Leitungen nicht direkt auf dem Funkmodul liegen (das
kann die Antenne verstimmen) und beim Zusammendrehen nirgendwo
eingeklemmt werden.
|
Bild 11: Eingeklebtes Elektret- mikrofon |
|
Bild 12: Positionierung der Leiterplatte |
|
Bild 13: Korrekt angeschlossenes Mikrofon |
|
Bild 14: Korrekter Anschluss der Klinkenbuchse und des Lautsprechers |
Test
Jetzt
kommt der große Moment: Schließen Sie ein Steckernetzteil mit einer
DC-Ausgangsspannung im Bereich von 6 V bis 18 V an die
3,5-mm-Klinkenbuchse an. Zur Gewährleistung der elektrischen Sicherheit
muss es sich bei der speisenden Quelle um eine
Sicherheits-Schutzkleinspannung handeln, die eine Leistung von nicht
mehr als 15 W liefern kann.
Der FS20 SS sollte sich, wenn alles in Ordnung ist, sofort mit
„Willkommen“ melden. Wenn Sie nichts hören, drücken Sie einmal die
Bedientaste. Falls noch immer nichts zu hören ist, prüfen Sie, ob die
Versorgungsspannung vorhanden und richtig gepolt ist (Mittelkontakt =
+). Wenn Sie immer noch keine „Willkommen“-Meldung hören, liegt ein
Hardware-Problem vor und Sie dürfen sich auf die Fehlersuche begeben.
Aber wenn Sie alles richtig gemacht haben, kann es jetzt mit dem Test
des FS20 SS weitergehen.
Bevor Sie das Gerät benutzen, muss als Erstes der Speicher gelöscht und
initialisiert werden – und das geht so: Ziehen Sie den Klinkenstecker
ab, halten Sie die Taste gedrückt, stecken Sie den Stecker bei
gedrückter Taste wieder ein und lassen Sie die Taste los. Jetzt passiert
erst mal nichts, aber wenn Sie noch einmal kurz auf die Taste drücken,
fragt Sie der FS20 SS: „Speicher löschen? Ja oder Nein.“ Jetzt muss die
rote LED leuchten, als Zeichen dafür, dass das Gerät eine Antwort
erwartet. Antworten Sie, indem Sie „Ja“ sagen. Der FS20 SS sollte nun
mit einem Doppelpiep antworten. Während des Löschens bleibt die rote LED
an. Nach ca. 10 Sek. meldet sich der FS20 SS: „Der Speicher ist leer.“ –
Piep – „Willkommen. Der Speicher ist leer. Benutzer eins.
Trainingsmodus. Sagen Sie ein Wort. [LED an]“
So weit, so gut. Wenn Sie jetzt schweigen, geht die LED nach 3 Sek.
wieder aus und Sie bekommen die Meldung: „Der Speicher ist leer. [LED
blinkt]“ Mit dieser Methode können Sie den FS20 SS jederzeit wieder in
den Werkszustand zurückversetzen. Wenn Sie beim Einstecken des FS20 SS
einmal versehentlich die Bedientaste gedrückt haben, ohne dass Sie das
Gerät zurücksetzen wollen, können Sie auf die Frage, ob der Speicher
gelöscht werden soll, einfach mit „Nein“ antworten, oder Sie ziehen den
Klinkenstecker heraus und stecken ihn bei nicht gedrückter Taste erneut
ein. Dabei wird auch die Hardware geprüft, und wenn alles O. K. ist,
können Sie jetzt mit dem Training beginnen.Die Bedientaste
Viele
Wege führen nach Rom und auch durch die Bedienung des FS20 SS. Alle
komplett zu beschreiben, würde mehrere Seiten erfordern. Wenn Sie das
Konzept aber erst einmal verstanden haben, ist die Bedienung recht
intuitiv. Der Taster ist der Zugang für alle Funktionen, die nicht mit
Sprache gesteuert werden. Die Funktion ist abhängig von der Dauer des
Tastendrucks. Ein kurzer Tastendruck (0 Sek. bis 1 Sek.) dient zum
direkten Steuern von FS20-Funkaktoren. Dazu später mehr.
Ein Tastendruck mittlerer Dauer (1 Sek. bis 2,5 Sek.) bis zum Ertönen
eines hohen Pieptons und schnellem Blinken der LED führt in den
Trainingsmodus. Ein langer Tastendruck (2,5 Sek. und länger) bis zum
Ertönen eines tiefen Pieptons und Erlöschen der LED führt in die
Hauscode-Einstellung. Bei vollständig leerem Speicher führt jeder
Tastendruck in den Trainingsmodus.Training
Der
FS20 SS hat vier Speicherplätze, die Sie mit beliebigen, individuellen
Wörtern belegen können. Jedes dieser Triggerwörter ist der Schlüssel zu
einer nachfolgenden Kommandowort-Erkennung. Die fünf Kommandowörter
sind: Aus, Ein, Niedrig, Mittel und Voll. Diese Kommandos funktionieren
sprecherunabhängig (!) und müssen nicht trainiert werden. Sie müssen
dem FS20 SS aber zunächst einmal beibringen, auf welche Triggerwörter er
hören soll und welches FS20-Gerät dadurch „angefunkt“ werden soll. Die
gesamte Bedienung erfolgt interaktiv und sprachgesteuert bzw. mit der
Taste. Ein Training besteht aus dem zweimaligen Sprechen Ihres selbst
gewählten Triggerworts und der nachfolgenden Eingabe der zugehörigen
FS20-Adresse.
Starten Sie das Training durch einen mittellangen Tastendruck (1 Sek.
bis 2,5 Sek.). Der FS20 SS meldet sich mit: „Benutzer eins.
Trainingsmodus. Sagen Sie ein Wort.“ Sprechen Sie jetzt laut und
deutlich Ihr gewünschtes Triggerwort, während die rote LED leuchtet. Es
folgt die Aufforderung: „Wiederholen Sie.“ Sagen Sie das gleiche Wort
noch einmal. Wenn alles O. K. ist, meldet der FS20 SS „Akzeptiert.
Adress-Setup“. Die genaue Beschreibung des FS20-Adresssystems können Sie
später der dem Gerät beiliegenden Bedienungsanleitung bzw. den
Anleitungen zu den FS20-Empfängern entnehmen.
Die Einstellung des vierstelligen Adresscodes für eine Speicherstelle
erfolgt in der Weise, dass der FS20 SS nacheinander alle 4 Stellen der
Adresse ansagt. Nach jeder Stelle haben Sie drei Sekunden Zeit, um mit
der Taste den Wert der Stelle zu ändern. Jeder Tastendruck zählt den
Wert zyklisch von eins bis vier hoch. Wenn 3 Sek. lang keine Taste
gedrückt wird, wird der zuletzt gewählte Wert übernommen. Diese
Einstellung erfolgt für alle vier Stellen der Adresse. Danach folgt die
Meldung „Erkennungsmodus“, und der FS20 SS hört nun auf Ihr trainiertes
Triggerwort.Erkennung
Sagen
Sie jetzt einmal Ihr Triggerwort, so wie Sie es trainiert haben. Sie
sollten einen Piepton hören, und die rote LED sollte angehen. Falls
nicht, probieren Sie es noch mal. Solange die LED leuchtet, erwartet der
FS20 SS danach ein Kommandowort von Ihnen (Aus, Ein, Niedrig, Mittel,
Voll). Sprechen Sie eines dieser Wörter. Der FS20 SS sollte das Wort
erkennen und mit einem tiefen Piepton und Verlöschen der LED bestätigen.
Voilà, Sie haben einen funktionierenden Spracherkenner!
Das Ganze macht natürlich erst Sinn, wenn Sie jetzt ein FS20-Gerät, z.
B. einen Funk-Dimmer, mit der passenden Adresse programmieren und
steuern können. Die Programmierung erfolgt in gewohnter Weise: z. B.
Funk-Dimmer in den Programmiermodus versetzen und per Sprachsteuerung
ein Kommando geben. Jedes erfolgreich erkannte Kommando bewirkt das
Senden eines Funksignals, so dass sich die Programmierung mit jedem
verfügbaren Kommando durchführen lässt. Nachdem der Dimmer auf den FS20
SS programmiert wurde, können Sie ihn nun per Sprachkommando bedienen.
Probieren Sie mit einer Lampe aus, was die verschiedenen Kommandos
bewirken.
So weit, so gut. Sie können es jetzt bei dem einen trainierten
Triggerwort belassen, oder Sie können bis zu drei weitere Wörter
trainieren. Begeben Sie sich dazu wieder in den Trainingsmodus. Wenn die
Benutzernummer angesagt wurde, können Sie, wie beim Adress-Setup, mit
der Bedientaste die vier Speicherplätze nacheinander durchschalten. Der
zuletzt ausgewählte Speicherplatz (Benutzer) wird beim folgenden
Training überschrieben. Falls schon ein Wort für diesen Benutzer im
Speicher vorhanden ist, fragt der FS20 SS, ob ein neues Training
durchgeführt werden soll. Antworten Sie mit „Ja“ oder „Nein“.
Anschließend wird wieder die aktuelle FS20-Adresse des Speicherplatzes
angesagt, die Sie bei Bedarf ändern können.
Sie können entweder mehrere Triggerwörter dazu verwenden, um das gleiche
Gerät zu schalten, z. B. wenn es von mehreren Personen bedient werden
soll, oder Sie können bis zu vier unterschiedliche Geräte mit jeweils
einem eigenen Namen individuell ansprechen. Die Zuordnung der Kommandos
ist durch die einzeln einstellbaren Adressen sehr flexibel
konfigurierbar. Lediglich der Hauscode ist für alle Geräte der gleiche.
Die Hauscode-Einstellung wird durch einen langen Tastendruck gestartet
und erfolgt genauso wie die Adresseinstellung, aber mit acht Stellen.
Hinweis: Das komplette Löschen des Speichers setzt den Hauscode und alle
Adressen auf die Defaultwerte 11111111 und 4444 (Master) zurück.Bedienung per Taster
Sie
können nun ein bis vier FS20-Geräte per Sprachkommando steuern. Wenn
Sie aber lieber einmal nichts sagen möchten, können Sie auch die Taste
dazu verwenden. Ein kurzer Tastendruck aktiviert die Kommandoerkennung
für den jeweils zuletzt aktiven Benutzer, bewirkt also praktisch das
Gleiche, als wenn das zuletzt erkannte Triggerwort noch mal gesagt
würde. Nun kann, solange die LED leuchtet, entweder eines der Kommandos
gesagt werden oder das betreffende FS20-Gerät kann per nochmaligem
Tastendruck gesteuert werden: Ein kurzer Tastendruck schaltet das Gerät
ein und aus (Toggle-Funktion), ein langer Tastendruck bewirkt ein
zyklisches Auf- und Abdimmen, bis die Taste losgelassen wird. Der
Helligkeitswert bleibt im Dimmer gespeichert, bis per Dimm-Kommando ein
neuer Wert vorgegeben wird.Weiterführende Hinweise
Sie
haben jetzt die Funktionsweise des FS20 SS kennen gelernt. Damit Sie
aber den optimalen Nutzen daraus ziehen können, empfehlen wir Ihnen,
sich die nachfolgenden Tipps und Tricks durchzu-lesen, denn eine gute
Funktionsweise hängt stark davon ab, dass das Training richtig
durchgeführt wird, dass geeignete Wörter ausgewählt werden und dass die
richtigen Einstellungen für den jeweiligen Einsatzort und -zweck gewählt
werden. Bedenken Sie, dass die erfolgreiche Spracherkennung nicht nur
vom FS20 SS an sich abhängt, sondern auch von der Akustik des Raumes und
insbesondere von Ihnen als Sprecher der Wörter. So wie Sie sich z. B.
auf einen Hund einstellen müssen, dem Sie ein Kommando antrainieren
wollen, müssen Sie sich auch mit dem FS20 SS beschäftigen, um die
optimale Funktion zu erreichen.
Wenngleich der FS20 SS mit modernster Spracherkennungstechnologie
arbeitet, ist es trotzdem nur eine elektrische Maschine, die den Sinn
Ihrer Kommandos nicht verstehen kann und die auf die vorgesehene
Bedienung angewiesen ist, um richtig zu funktionieren. Selbst Ihr
eigenes, extrem leistungsfähiges Gehirn versteht manchmal ein Wort
falsch oder gar nicht. Erwarten Sie deshalb bitte nicht, dass der FS20
SS unter allen Umständen richtig reagiert, denn Spracherkennung ist
keine exakte Wissenschaft und immer ein Kompromiss zwischen
ausreichender Sicherheit gegen Störgeräusche und Toleranz gegenüber
andersartiger Aussprache. Nehmen Sie sich etwas Zeit und spielen Sie mit
den Funktionen des FS20 SS, um seine Eigenschaften kennen zu lernen.Spracherkennung in der Praxis
Nach
jedem Trainingsdurchlauf gelangen Sie automatisch in den
Erkennungsmodus. Der FS20 SS hört jetzt ständig auf alle trainierten
Triggerwörter. Dazu versucht er zunächst, einzelne Wörter aus der Fülle
der Geräusche zu isolieren. Kommandos müssen immer von einer kurzen
Pause am Anfang und am Ende eingerahmt werden. Wenn trainierte Wörter in
einem fließend gesprochenen Text ohne ausreichende Pausen auftreten,
kann der FS20-Sprachsensor diese Wörter nicht isolieren und wird nicht
darauf reagieren. Der Sprachsensor kann den Sinn der Wörter, die Sie
trainieren, nicht verstehen. Er vermag lediglich, einen Klang mit einem
vorher trainierten Klang zu vergleichen und auf Ähnlichkeit zu
überprüfen. Wenn Sie es wollen, wird es Ihnen leicht gelingen, ihn mit
ähnlich klingenden Wörtern auszutricksen. Die Erkennung von
Kommandowörtern können Sie ungefähr mit der eines trainierten Hundes
vergleichen. Wenn Sie beispielsweise Ihren Hund darauf abgerichtet
haben, Ihnen beim Kommando „Pantoffeln“ Ihre Hausschuhe zu bringen, dann
wird er das wahrscheinlich auch tun, wenn Sie stattdessen „Kartoffeln“
sagen, obwohl das völliger Unsinn ist. Der Grund, warum Sie ein
Spracherkennungssystem benutzen möchten, ist aber vermutlich nicht, dass
Sie mit ihm lustige Wortspiele machen wollen, sondern vielmehr, dass
Sie es sinnvoll und möglichst zuverlässig nutzen wollen. In der
Bedienungsanleitung erhalten Sie daher einige wichtige Tipps, deren
Einhaltung viel zur erfolgreichen Anwendung beiträgt.Fachbeitrag online und als PDF-Download herunterladen
Inhalt
Sie erhalten den Artikel in 2 Versionen:
als Online-Version
als PDF (5 Seiten)
Sie erhalten folgende Artikel:
- FS20-Sprachsensor FS20 SS – Spracherkennungs-Grundlagen Teil 2/2
- 1 x Journalbericht
- 1 x Schaltplan
weitere Fachbeiträge | Foren | |
Hinterlassen Sie einen Kommentar: