Microsoft ist sehr bestrebt, Copilot in Windows 11 und immer weitere Programme einfließen zu lassen. Ein nun durchgesickertes Patent deutet auf eine neue Funktion hin, die generative Bilderstellung als Präsentationshilfsmittel in Programmen mit Spracheingabe wie Teams etablieren könnte.

Patent für Live-Bilderstellung

Wie das Online-Magazin MSPowerUser berichtet, zeigt das Patentdokument ein System, mit dem Ton-Aufnahmen per KI in Bilder umgesetzt werden. Der Beschreibung zufolge soll das Tool Sprachaufnahmen zunächst in Text transkribieren. Der transkribierte Text wird dann von der KI analysiert und zusammengefasst, um die notwendigen Prompts für die Bilderstellung zu erhalten.

Windows 11

Windows-11-Lizenz für 14,90 Euro

Sichern Sie sich einen Lizenzschlüssel für Windows 11 bei Lizensio – für 14,90 statt 145 Euro (Home) oder statt 259 Euro (Pro). Sie sparen bis zu 94 Prozent gegenüber der UVP!

Besseres Verständnis durch KI-Bilder?

Die Bilder werden dann in dem entsprechenden Programmfenster oder eventuell auch in einem eigenen Tool dargestellt. Die Bildschöpfung soll ohne Verzögerung erfolgen, sodass, wenn beispielsweise ein Sprecher das Thema wechselt, die KI umgehend ein neues Bild zur Veranschaulichung generiert. Der Sinn dieser Technik liegt genau in dieser Präsentation, um Konzepte verständlicher erklären zu können und um Inhalte durch visuelle Stützen besser vermitteln zu können.

Wie setzt Microsoft die Patentpläne um?

Es ist allerdings fraglich, ob diese Funktion in dieser Form wirklich erscheinen wird. Auf Basis dieses Patents könnten aber Hilfsmittel zur Barrierefreiheit, für die Schulbildung oder tatsächlich für berufliche Zusammenhänge entwickelt werden. Es bleibt also abzuwarten, was Microsoft mit dieser Technik anstellen wird.

Categories: Uncategorized

Call Now Button