Ein Forscherteam trainiert ein KI-Modell mit Tastenanschlägen eines Laptops, aufgezeichnet per Mikrofon. Die Trefferquote liegt anschließend bei 95 Prozent.
In dem Paper werden zwei Versuche durchgeführt, einmal mit einer Audioaufnahme eines iPhone 13 und einmal über Zoom.
Der erste Versuch scheint mir plausibel, beim zweiten Versuch frag ich mich, ob die Tastaturgeräusche nicht gefiltert werden? Ich hör so gut wie nie jemanden tippen bei Teams anrufen.
In dem Paper werden zwei Versuche durchgeführt, einmal mit einer Audioaufnahme eines iPhone 13 und einmal über Zoom.
Der erste Versuch scheint mir plausibel, beim zweiten Versuch frag ich mich, ob die Tastaturgeräusche nicht gefiltert werden? Ich hör so gut wie nie jemanden tippen bei Teams anrufen.