FS20-Sprachsensor FS20 SS – Spracherkennungs-Grundlagen Teil 2/2

0,00
Aus ELVjournal 02/2006     0 Kommentare
 FS20-Sprachsensor FS20 SS – Spracherkennungs-Grundlagen Teil 2/2
Bausatzinformationen
ungefähr Bauzeit(Std.)Verwendung von SMD-Bauteilen.
20,75OK2/2006

Inhalt des Fachbeitrags

PDF- / Onlineversion herunterladen

Technische Daten

4
sprecherabhängige Triggerwörter, sprecherunabhängige Kommandos
Aus, Ein, Niedrig, Mittel und Voll
Niedrig (38 %), Mittel (69 %), Voll (100 %)
11111111
4444
6 VDC bis 18 VDC/60 mA
3,5-mm-Klinkenstecker (Mittelkontakt = +)
110 x 63 mm

Nachdem im letzten „ELVjournal“ die Grundlagen der Spracherkennung am Beispiel des Sprachprozessors RSC 4128 erläutert wurden, geht es jetzt an die Realisierung einer Sprachsteuerung für das FS20-Funksystem.

Ein UFO, das aufs Wort hört

Passend zum Science-Fiction-Feeling, ist der FS20-Sprachsensor (FS20 SS) in einem kleinen Tischgehäuse verpackt, das ein bisschen an ein Mini-UFO erinnert und das von einem handelsüblichen Steckernetzteil versorgt wird. Die akustischen Sprachkommandos werden vom eingebauten Mikrofon umgewandelt und in den Sprachprozessor eingespeist, der die Erkennung vornimmt und über ein Funk-Sendemodul andere Geräte des FS20-Funksystems ansteuern kann.
Bild 8: Schaltbild der Spracherkennung FS20 SS
Bild 8: Schaltbild der Spracherkennung FS20 SS
Über die Klinkenbuchse, die an ST 1 und ST 2 angeschlossen ist, wird der FS20 SS von einem externen Steckernetzteil mit 6 V bis 18 V Gleichspannung versorgt. D 1 sorgt für den Verpolungsschutz, und der lineare Spannungsregler IC 1 mit den Kondensatoren C 1 bis C 4 erzeugt die 3,3 V Versorgungsspannung für den Rest der Schaltung (Abbildung 8). Der Sprachprozessor RSC 4128 (IC 4) bildet den Kern des FS20 SS, der von einem 3,58-MHz-Quarz (Q 1) getaktet wird. R 1, D 2 und C 15 sorgen für einen definierten Einschalt-Reset. Die Betriebs-Firmware befindet sich im Speicher IC 2. Zur Speicherung der trainierten Wortmuster kommt ein serielles EEPROM vom Typ 24LC16B zum Einsatz. Die einzige Bedientaste TA 1 ist direkt mit einem I/O-Pin verbunden, ein weiterer I/O-Pin schaltet die Leuchtdiode D 3 über den Vorwiderstand R 3. Da der RSC 4128 einen eingebauten PWM-Ausgang für eine direkte Lautsprecheransteuerung beinhaltet, ist lediglich ein kleines RC-Netzwerk (C 10 und R 2) zur Filterung des Ausgangssignals und zur Anpassung an den Lautsprecher notwendig. Das Elektretmikrofon erhält seine Betriebsspannung über ein Filternetzwerk aus R 4, R 5, C 24 und C 25. Das durch C 23 entkoppelte und durch D 4 und D 5 gegen eventuelle statische Entladungen geschützte Audio-Signal wird direkt in den Mikrofoneingang des RSC 4128 geführt. Die Kondensatoren (C 16 bis C 19) sorgen für eine saubere Pufferung der analogen Schaltungsteile des Prozessors, die obligatorischen 100-nF-Stützkondensatoren an jedem digitalen Versorgungsspannungspin sind besonders bei gemischten Analog- und Digitalschaltungen Pflicht. Zur Kommunikation mit dem FS20-Funk-Schaltsystem dient schließlich das Funk-Sendemodul HFS 1, welches direkt von einem I/O-Pin angesteuert wird.

Nachbau

Die FS20-SS-Platine ist zum großen Teil in SMD-Technologie aufgebaut. Um den Nachbau zu erleichtern, enthält der ELV-Bausatz eine teilbestückte Platine, auf der alle SMD-Bauteile bereits vormontiert sind. Es müssen also lediglich die bedrahteten Bauelemente, die Verdrahtung und der Zusammenbau durchgeführt werden. Die Bestückung der Bauteile erfolgt in gewohnter Weise anhand der Stückliste und des Bestückungsdrucks auf der Platine. Bei den gepolten Bauteilen (Elkos, LED) ist auf die richtige Einbaulage gemäß des Bestückungsdruckes zu achten. Alle bedrahteten Teile werden auf der Bestückungsseite der Platine montiert (das ist die Seite mit den SMD-ICs), mit Ausnahme von drei Komponenten: der Taster, die LED und der Anschluss des Mikrofons werden auf der Lötseite montiert, so dass Sie beim späteren Zusammenbau nach oben in Richtung der entsprechenden Löcher der oberen Gehäusehalbschale zeigen. Die LED wird so montiert, dass sich die Spitze des LED-Gehäuses 13 mm oberhalb der Platine befindet. Der Datenspeicher IC 2 (ELV05519) ist dann polungsrichtig in den bereits aufgelöteten PLCC-Sockel zu stecken. Anschließend sind die Leitungen für die Verdrahtung zu bestücken. Löten Sie zwei schwarze, flexible Leitungen (Länge 100 mm) für den Lautsprecheranschluss (ST 3, ST 4) und zwei Leitungen (Rot an ST 1, Schwarz an ST 2, Länge 110 mm) für die Spannungsversorgung von der Unterseite in die entsprechenden Bohrungen der Platine ein. Für den Mikrofonanschluss löten Sie die zwei dünnen Wire-Wrap-Drähte (je 30 mm lang) von der Oberseite in die zugehörigen Anschlüsse auf der Platine ein, so dass das Ganze so aussieht wie in Abbildung 10. Zum Abschluss der Bestückungsarbeiten ist das Funk-Sendemodul HFS 1 zu montieren. Dieses wird so von der Bestückungsseite eingesetzt, dass die Anschlusspins auf der Lötseite ca. 2 mm durchstehen. Vor dem Anlöten der Stiftleiste sollte die waagerechte Positionierung nochmals geprüft werden. Damit ist die Platine fertig vorbereitet, und es kann an den Zusammenbau gehen.

Gehäuseeinbau

Bild 9: Vorbereitetes Gehäuse- unterteil
Bild 9: Vorbereitetes Gehäuse- unterteil
Zunächst muss das Gehäuse wie folgt vorbereitet werden: Schrauben Sie die Klinkenbuchse in den Gehäusesockel und kleben Sie die vier Gummifüße an die markierten Stellen. Drehen Sie den Gehäusesockel in die untere Halbschale, so dass der kleine Pfeil im Sockel genau in die Lücke der vorderen Plastiklaschen der Halbschale zeigt (Abbildung 9).
Bild 10: Bestückte Platine mit angelöteten Anschlussleitungen
Bild 10: Bestückte Platine mit angelöteten Anschlussleitungen
In der oberen Halbschale wird jetzt die Platine eingebaut (Abbildung 10). Das Mik­rofon ist bereits eingeklebt, so dass lediglich die vorbereiteten Leitungen angelötet werden müssen. Da das Mikrofon gepolt ist, ist der richtige Anschluss entsprechend der Abbildungen 11 bis 13 sehr wichtig. Wenn die Drähte angelötet sind, wird die Platine vorsichtig so positioniert, dass Taster und LED in die entsprechenden Löcher passen. Achten Sie dabei darauf, dass die empfindlichen Mikrofonleitungen nicht brechen oder von den Lötstellen abreißen. Fixieren Sie die Platine mit den vier kleinen Schrauben 2,5 x 6 mm. Nun werden die Leitungen für Lautsprecher und Spannungsversorgung entsprechend Abbildung 14 verdrahtet. Zum Anschluss der Klinkenbuchse ist die rote Ader (von ST 1 kommend) an den von hinten gesehen rechten Anschluss zu löten, die schwarze Ader (von ST 2) entsprechend an den linken Anschluss.Als Letztes werden die Gehäuseschalen aufeinander gelegt und zusammengedreht. Richtig eingesetzt lassen sich beide Teile leicht ineinander legen und durch Verdrehen einrasten. Achten Sie darauf, dass die Leitungen nicht direkt auf dem Funkmodul liegen (das kann die Antenne verstimmen) und beim Zusammendrehen nirgendwo eingeklemmt werden.
Bild 11: Eingeklebtes Elektret- mikrofon
Bild 11: Eingeklebtes Elektret- mikrofon
Bild 12: Positionierung  der Leiterplatte
Bild 12: Positionierung der Leiterplatte
Bild 13: Korrekt angeschlossenes  Mikrofon
Bild 13: Korrekt angeschlossenes Mikrofon
Bild 14: Korrekter Anschluss der Klinkenbuchse und des Lautsprechers
Bild 14: Korrekter Anschluss der Klinkenbuchse und des Lautsprechers

Test

Jetzt kommt der große Moment: Schließen Sie ein Steckernetzteil mit einer DC-Ausgangsspannung im Bereich von 6 V bis 18 V an die 3,5-mm-Klinkenbuchse an. Zur Gewährleistung der elektrischen Sicherheit muss es sich bei der speisenden Quelle um eine Sicherheits-Schutzkleinspannung handeln, die eine Leistung von nicht mehr als 15 W liefern kann. Der FS20 SS sollte sich, wenn alles in Ordnung ist, sofort mit „Willkommen“ melden. Wenn Sie nichts hören, drücken Sie einmal die Bedientaste. Falls noch immer nichts zu hören ist, prüfen Sie, ob die Versorgungsspannung vorhanden und richtig gepolt ist (Mittelkontakt = +). Wenn Sie immer noch keine „Willkommen“-Meldung hören, liegt ein Hardware-Problem vor und Sie dürfen sich auf die Fehlersuche begeben. Aber wenn Sie alles richtig gemacht haben, kann es jetzt mit dem Test des FS20 SS weitergehen. Bevor Sie das Gerät benutzen, muss als Erstes der Speicher gelöscht und initialisiert werden – und das geht so: Ziehen Sie den Klinkenstecker ab, halten Sie die Taste gedrückt, stecken Sie den Stecker bei gedrückter Taste wieder ein und lassen Sie die Taste los. Jetzt passiert erst mal nichts, aber wenn Sie noch einmal kurz auf die Taste drücken, fragt Sie der FS20 SS: „Speicher löschen? Ja oder Nein.“ Jetzt muss die rote LED leuchten, als Zeichen dafür, dass das Gerät eine Antwort erwartet. Antworten Sie, indem Sie „Ja“ sagen. Der FS20 SS sollte nun mit einem Doppelpiep antworten. Während des Löschens bleibt die rote LED an. Nach ca. 10 Sek. meldet sich der FS20 SS: „Der Speicher ist leer.“ – Piep – „Willkommen. Der Speicher ist leer. Benutzer eins. Trainingsmodus. Sagen Sie ein Wort. [LED an]“ So weit, so gut. Wenn Sie jetzt schweigen, geht die LED nach 3 Sek. wieder aus und Sie bekommen die Meldung: „Der Speicher ist leer. [LED blinkt]“ Mit dieser Methode können Sie den FS20 SS jederzeit wieder in den Werkszustand zurückversetzen. Wenn Sie beim Einstecken des FS20 SS einmal versehentlich die Bedientaste gedrückt haben, ohne dass Sie das Gerät zurücksetzen wollen, können Sie auf die Frage, ob der Speicher gelöscht werden soll, einfach mit „Nein“ antworten, oder Sie ziehen den Klinkenstecker heraus und stecken ihn bei nicht gedrückter Taste erneut ein. Dabei wird auch die Hardware geprüft, und wenn alles O. K. ist, können Sie jetzt mit dem Training beginnen.

Die Bedientaste

Viele Wege führen nach Rom und auch durch die Bedienung des FS20 SS. Alle komplett zu beschreiben, würde mehrere Seiten erfordern. Wenn Sie das Konzept aber erst einmal verstanden haben, ist die Bedienung recht intuitiv. Der Taster ist der Zugang für alle Funktionen, die nicht mit Sprache gesteuert werden. Die Funktion ist abhängig von der Dauer des Tastendrucks. Ein kurzer Tastendruck (0 Sek. bis 1 Sek.) dient zum direkten Steuern von FS20-Funkaktoren. Dazu später mehr. Ein Tastendruck mittlerer Dauer (1 Sek. bis 2,5 Sek.) bis zum Ertönen eines hohen Pieptons und schnellem Blinken der LED führt in den Trainingsmodus. Ein langer Tastendruck (2,5 Sek. und länger) bis zum Ertönen eines tiefen Pieptons und Erlöschen der LED führt in die Hauscode-Einstellung. Bei vollständig leerem Speicher führt jeder Tastendruck in den Trainingsmodus.

Training

Der FS20 SS hat vier Speicherplätze, die Sie mit beliebigen, individuellen Wörtern belegen können. Jedes dieser Triggerwörter ist der Schlüssel zu einer nachfolgenden Kommandowort-Erkennung. Die fünf Kommandowörter sind: Aus, Ein, Niedrig, Mittel und Voll. Diese Kommandos funk­tionieren sprecherunabhängig (!) und müssen nicht trainiert werden. Sie müssen dem FS20 SS aber zunächst einmal beibringen, auf welche Triggerwörter er hören soll und welches FS20-Gerät dadurch „angefunkt“ werden soll. Die gesamte Bedienung erfolgt interaktiv und sprachgesteuert bzw. mit der Taste. Ein Training besteht aus dem zweimaligen Sprechen Ihres selbst gewählten Triggerworts und der nachfolgenden Eingabe der zugehörigen FS20-Adresse. Starten Sie das Training durch einen mittellangen Tastendruck (1 Sek. bis 2,5 Sek.). Der FS20 SS meldet sich mit: „Benutzer eins. Trainingsmodus. Sagen Sie ein Wort.“ Sprechen Sie jetzt laut und deutlich Ihr gewünschtes Triggerwort, während die rote LED leuchtet. Es folgt die Aufforderung: „Wiederholen Sie.“ Sagen Sie das gleiche Wort noch einmal. Wenn alles O. K. ist, meldet der FS20 SS „Akzeptiert. Adress-Setup“. Die genaue Beschreibung des FS20-Adresssystems können Sie später der dem Gerät beiliegenden Bedienungsanleitung bzw. den Anleitungen zu den FS20-Empfängern entnehmen. Die Einstellung des vierstelligen Adresscodes für eine Speicherstelle erfolgt in der Weise, dass der FS20 SS nacheinander alle 4 Stellen der Adresse ansagt. Nach jeder Stelle haben Sie drei Sekunden Zeit, um mit der Taste den Wert der Stelle zu ändern. Jeder Tastendruck zählt den Wert zyklisch von eins bis vier hoch. Wenn 3 Sek. lang keine Taste gedrückt wird, wird der zuletzt gewählte Wert übernommen. Diese Einstellung erfolgt für alle vier Stellen der Adresse. Danach folgt die Meldung „Erkennungsmodus“, und der FS20 SS hört nun auf Ihr trainiertes Triggerwort.

Erkennung

Sagen Sie jetzt einmal Ihr Triggerwort, so wie Sie es trainiert haben. Sie sollten einen Piepton hören, und die rote LED sollte angehen. Falls nicht, probieren Sie es noch mal. Solange die LED leuchtet, erwartet der FS20 SS danach ein Kommandowort von Ihnen (Aus, Ein, Niedrig, Mittel, Voll). Sprechen Sie eines dieser Wörter. Der FS20 SS sollte das Wort erkennen und mit einem tiefen Piepton und Verlöschen der LED bestätigen. Voilà, Sie haben einen funktionierenden Spracherkenner! Das Ganze macht natürlich erst Sinn, wenn Sie jetzt ein FS20-Gerät, z. B. einen Funk-Dimmer, mit der passenden Adresse programmieren und steuern können. Die Programmierung erfolgt in gewohnter Weise: z. B. Funk-Dimmer in den Programmiermodus versetzen und per Sprachsteuerung ein Kommando geben. Jedes erfolgreich erkannte Kommando bewirkt das Senden eines Funksignals, so dass sich die Programmierung mit jedem verfügbaren Kommando durchführen lässt. Nachdem der Dimmer auf den FS20 SS programmiert wurde, können Sie ihn nun per Sprachkommando bedienen. Probieren Sie mit einer Lampe aus, was die verschiedenen Kommandos bewirken. So weit, so gut. Sie können es jetzt bei dem einen trainierten Triggerwort belassen, oder Sie können bis zu drei weitere Wörter trainieren. Begeben Sie sich dazu wieder in den Trainingsmodus. Wenn die Benutzernummer angesagt wurde, können Sie, wie beim Adress-Setup, mit der Bedientaste die vier Speicherplätze nacheinander durchschalten. Der zuletzt ausgewählte Speicherplatz (Benutzer) wird beim folgenden Training überschrieben. Falls schon ein Wort für diesen Benutzer im Speicher vorhanden ist, fragt der FS20 SS, ob ein neues Training durchgeführt werden soll. Antworten Sie mit „Ja“ oder „Nein“. Anschließend wird wieder die aktuelle FS20-Adresse des Speicherplatzes angesagt, die Sie bei Bedarf ändern können. Sie können entweder mehrere Triggerwörter dazu verwenden, um das gleiche Gerät zu schalten, z. B. wenn es von mehreren Personen bedient werden soll, oder Sie können bis zu vier unterschiedliche Geräte mit jeweils einem eigenen Namen individuell ansprechen. Die Zuordnung der Kommandos ist durch die einzeln einstellbaren Adressen sehr flexibel konfigurierbar. Lediglich der Hauscode ist für alle Geräte der gleiche. Die Hauscode-Einstellung wird durch einen langen Tastendruck gestartet und erfolgt genauso wie die Adresseinstellung, aber mit acht Stellen. Hinweis: Das komplette Löschen des Speichers setzt den Hauscode und alle Adressen auf die Defaultwerte 11111111 und 4444 (Master) zurück.

Bedienung per Taster

Sie können nun ein bis vier FS20-Geräte per Sprachkommando steuern. Wenn Sie aber lieber einmal nichts sagen möchten, können Sie auch die Taste dazu verwenden. Ein kurzer Tastendruck aktiviert die Kommandoerkennung für den jeweils zuletzt aktiven Benutzer, bewirkt also praktisch das Gleiche, als wenn das zuletzt erkannte Triggerwort noch mal gesagt würde. Nun kann, solange die LED leuchtet, entweder eines der Kommandos gesagt werden oder das betreffende FS20-Gerät kann per nochmaligem Tastendruck gesteuert werden: Ein kurzer Tastendruck schaltet das Gerät ein und aus (Toggle-Funktion), ein langer Tastendruck bewirkt ein zyklisches Auf- und Abdimmen, bis die Taste losgelassen wird. Der Helligkeitswert bleibt im Dimmer gespeichert, bis per Dimm-Kommando ein neuer Wert vorgegeben wird.

Weiterführende Hinweise

Sie haben jetzt die Funktionsweise des FS20 SS kennen gelernt. Damit Sie aber den optimalen Nutzen daraus ziehen können, empfehlen wir Ihnen, sich die nachfolgenden Tipps und Tricks durchzu-lesen, denn eine gute Funktionsweise hängt stark davon ab, dass das Training richtig durchgeführt wird, dass geeignete Wörter ausgewählt werden und dass die richtigen Einstellungen für den jeweiligen Einsatzort und -zweck gewählt werden. Bedenken Sie, dass die erfolgreiche Spracherkennung nicht nur vom FS20 SS an sich abhängt, sondern auch von der Akustik des Raumes und insbesondere von Ihnen als Sprecher der Wörter. So wie Sie sich z. B. auf einen Hund einstellen müssen, dem Sie ein Kommando antrainieren wollen, müssen Sie sich auch mit dem FS20 SS beschäftigen, um die optimale Funktion zu erreichen. Wenngleich der FS20 SS mit modernster Spracherkennungstechnologie arbeitet, ist es trotzdem nur eine elektrische Maschine, die den Sinn Ihrer Kommandos nicht verstehen kann und die auf die vorgesehene Bedienung angewiesen ist, um richtig zu funktionieren. Selbst Ihr eigenes, extrem leistungsfähiges Gehirn versteht manchmal ein Wort falsch oder gar nicht. Erwarten Sie deshalb bitte nicht, dass der FS20 SS unter allen Umständen richtig reagiert, denn Spracherkennung ist keine exakte Wissenschaft und immer ein Kompromiss zwischen ausreichender Sicherheit gegen Störgeräusche und Toleranz gegenüber andersartiger Aussprache. Nehmen Sie sich etwas Zeit und spielen Sie mit den Funk­tionen des FS20 SS, um seine Eigenschaften kennen zu lernen.

Spracherkennung in der Praxis

Nach jedem Trainingsdurchlauf gelangen Sie automatisch in den Erkennungsmodus. Der FS20 SS hört jetzt ständig auf alle trainierten Triggerwörter. Dazu versucht er zunächst, einzelne Wörter aus der Fülle der Geräusche zu isolieren. Kommandos müssen immer von einer kurzen Pause am Anfang und am Ende eingerahmt werden. Wenn trainierte Wörter in einem fließend gesprochenen Text ohne ausreichende Pausen auftreten, kann der FS20-Sprachsensor diese Wörter nicht isolieren und wird nicht darauf reagieren. Der Sprachsensor kann den Sinn der Wörter, die Sie trainieren, nicht verstehen. Er vermag lediglich, einen Klang mit einem vorher trainierten Klang zu vergleichen und auf Ähnlichkeit zu überprüfen. Wenn Sie es wollen, wird es Ihnen leicht gelingen, ihn mit ähnlich klingenden Wörtern auszutricksen. Die Erkennung von Kommandowörtern können Sie ungefähr mit der eines trainierten Hundes vergleichen. Wenn Sie beispielsweise Ihren Hund darauf abgerichtet haben, Ihnen beim Kommando „Pantoffeln“ Ihre Hausschuhe zu bringen, dann wird er das wahrscheinlich auch tun, wenn Sie stattdessen „Kartoffeln“ sagen, obwohl das völliger Unsinn ist. Der Grund, warum Sie ein Spracherkennungssystem benutzen möchten, ist aber vermutlich nicht, dass Sie mit ihm lustige Wortspiele machen wollen, sondern vielmehr, dass Sie es sinnvoll und möglichst zuverlässig nutzen wollen. In der Bedienungsanleitung erhalten Sie daher einige wichtige Tipps, deren Einhaltung viel zur erfolgreichen Anwendung beiträgt.

Fachbeitrag online und als PDF-Download herunterladen

Inhalt

Sie erhalten den Artikel in 2 Versionen:

online  als Online-Version

pdf  als PDF (5 Seiten)

Sie erhalten folgende Artikel:
  • FS20-Sprachsensor FS20 SS – Spracherkennungs-Grundlagen Teil 2/2
    • 1 x Journalbericht
    • 1 x Schaltplan


Hinterlassen Sie einen Kommentar:
  Name
  E-Mail
KATEGORIEN
DAS KÖNNTE SIE AUCH INTERESSIEREN