Generative KI für Unternehmen und der Datenschutz
Autor/Redakteur: Christian Schmitz, Director Open Source bei plusserver/gg
In Unternehmen wird häufig mit Dokumenten und Texten gearbeitet: E-Mails lesen und beantworten, Verträge verstehen, Protokolle schreiben und Kunden-Feedback auswerten. Es ist naheliegend, hierfür Generative KI wie ChatGPT, Mistral oder plusKI zu nutzen. Zum typischen Softwarekatalog der meisten Unternehmen gehört KI aber nicht. Die Folge: Es entsteht eine neue Art von Schatten-IT.
Laut aktueller Daten von Statista nutzten Mitte 2023 knapp 64 Prozent der deutschen Berufstätigen ChatGPT für die Arbeit. Daten aus den USA von Anfang 2023 legen nahe, dass eine große Mehrheit der Nutzer (70 Prozent) KI inoffiziell nutzt. Die Zahlen in Deutschland dürften sehr ähnlich sein. Das ist sowohl aus Sicht des Datenschutzes als auch unter Cybersecurity-Aspekten sehr risikoreich.
Generative KI bringt Unternehmen viele Vorteile
Zahlreiche Entwickler von generativer KI stammen aus den USA oder China. Zumindest in ihren Heimatmärkten vertreten diese Unternehmen andere Datenschutzkonzepte als in der EU üblich. Eingegebene Daten werden gespeichert und für das Training oder die Feineinstellung der Modelle genutzt. Dadurch ist es leicht möglich, dass Geschäftsgeheimnisse oder geschützte Personendaten ihren Weg in die Sprachmodelle finden. Zudem kann die KI fehlerhafte Angaben machen.
Der Schlüsselaspekt beim sicheren KI-Einsatz ist die Kontrolle über die Daten. Das ist mit den bisher präsentierten Sprachmodellen der großen Player nur schwer möglich. Trotzdem haben moderne Sprachmodelle viele Vorteile und können das Personal deutlich entlasten. KI übernimmt mühsame und zeitaufwendige Aufgaben wie das Schreiben von Berichten, Protokollen oder E-Mails. Viele Prozesse wie Antworten auf Kundenanfragen werden beschleunigt. Zudem sind Sprachmodelle in der Lage, E-Mails und Dokumente zu analysieren und beispielsweise die Intention eines Kunden zu erkennen.
Unternehmen sollten sich der neuen Technologie nicht verschließen, zumal die Mitarbeiter die Neuerungen häufig durch die Hintertür einführen. Eine sinnvolle Lösung ist eine Inhouse-KI, die mit internen Daten trainiert wird und beispielsweise beim Schreiben von Texten mit Unternehmensinhalten hilft. Möglich wird das durch Open-Source-Software (OSS).
Open-Source-KI für Unternehmen
Das Training eines großen Sprachmodells erfordert eine hochentwickelte und leistungsfähige Hardware. Bei OSS-Projekten muss diese entweder selbst angeschafft oder über einen externen Partner in der Cloud zur Verfügung gestellt werden. Auf diese Weise kann die Hardware an die Bedürfnisse angepasst werden, damit die geforderten Aufgaben im Unternehmen erfüllt werden können – vorausgesetzt das Modell wird spezifisch antrainiert. Dabei werden vom Unternehmen genutzte Texte eingesetzt, etwa interne Dokumente, E-Mails und Inhalte aus CRM-Systemen oder Wissensdatenbanken.
Für dieses sogenannte Anreichern des Modells mit internen Daten muss ein gut geplanter Prozess aufgesetzt werden, damit Daten, Aufgaben und Fähigkeiten der OSS-KI auch zusammenpassen. Im Anschluss hat das Modell ausreichend „Wissen“, um beispielsweise bei Kundenanfragen oder der Formulierung von Dokumenten helfen zu können. Dadurch erreichen die Unternehmen einen weiteren Vorteil: Die Bedienung der Sprachmodelle ist einfacher. Da GPT & Co. keine spezifischen, eigenen Nutzerinhalte kennen, muss jeder Arbeitsgang durch umfangreiches „Prompt Engineering“ mit den gewünschten spezifischen Informationen vorbereitet werden. Besonders komfortabel ist das nicht und stößt an praktische Umsetzungsgrenzen. Ein mit eigenen Daten nutzbares OSS-Modell kann dagegen direkt befragt werden.
Doch diese Vorgehensweise erfordert IT-Ressourcen und viel Know-how im Unternehmen. Eine weniger aufwendige Alternative ist die Nutzung von „AI as a Service“. Wie bei allen XaaS-Angeboten betreibt hierbei der Anbieter das Modell und sorgt für Zuverlässigkeit und Sicherheit. Ideal ist dafür ein deutscher Serviceprovider, der den EU-Datenschutz erfüllt und KI in einer Private Cloud anbietet. Das erlaubt den sicheren Betrieb von KI ohne Probleme mit Datensicherheit und -schutz.