Die rasante Verbreitung von IoT-Geräten steigert die Nachfrage nach Smart-Home-Lösungen. Home-Speak zielt darauf ab, Interoperabilität, Leistung und Benutzerfreundlichkeit zu evaluieren und optimal zu kombinieren. Ein Prototyp, basierend auf einem ESP32-Mikrocontroller, zeigt Möglichkeiten, aber auch Herausforderungen. Latenz und Energieverbrauch müssen in zukünftigen Produkten verbessert werden. Machine-Learning ist ein Ansatz dazu.
Die rasante Verbreitung von IoT-Geräten in Haushalten erhöht die Nachfrage nach benutzerfreundlichen und effizienten Smart-Home-Lösungen. Es gibt bereits viele Systeme auf dem Markt, die sehr gut funktionieren. Allerdings weisen viele Systeme bei einem oder mehreren der drei Punkte Interoperabilität, Leistung und Benutzerfreundlichkeit Einschränkungen auf. Die Frage ist: Kann ein Home-Speak entwickelt werden, welches diese drei Punkte optimal kombiniert?
Das primäre Ziel von "Home-Speak" ist die Entwicklung eines Prototyps, der eine nahtlose Spracherkennung und -steuerung für Smart-Home-Geräte ermöglicht. Dies umfasst die Implementierung eines ESP32-Mikrocontrollers, die Evaluation verschiedener Spracherkennungstechnologien und die Sicherstellung einer zuverlässigen drahtlosen Kommunikation über WLAN und Bluetooth. Eine der Herausforderungen und zugleich ein Hauptnutzen dieser Arbeit besteht darin, diese drei Aspekte zu erforschen und zu kombinieren: Interoperabilität, Leistung und Benutzerfreundlichkeit.
Das gesamte System soll als Mikrocontroller in einem alten Retro-Funkgerät umgesetzt werden.
Das Ziel, den Lösungsraum von Interoperabilität, Leistung und Benutzerfreundlichkeit zu erkunden und bestmöglich zu optimieren, wurde erreicht. Durch detaillierte Experimente konnte die Spracherkennung verbessert werden. Allerdings wurden signifikante Schwächen in den Bereichen Latenz und Energieverbrauch festgestellt. Diese Hindernisse müssen in zukünftigen Produkten, die auf dieser Architektur basieren, überwunden werden. Besonders die Latenzzeit, die stark von der Interoperabilität beeinflusst wird, bleibt ein kritischer Punkt, der sowohl die Leistung als auch die Benutzerfreundlichkeit beeinträchtigt. Eine mögliche Lösung könnte der Einsatz von Machine- Learning-Modellen zur Reduktion der Latenzzeit sein.