[ˈjʊstaˈmɛnt]
[1] gerade, eben jetzt
[2] ausgerechnet, nun erst recht
[3] IT-Dienstleister in Wien
20. Aug. 2024

KI für kleine Unternehmen: Datenaggregation und Suche im Internet

Die bisherigen Beiträge unserer Serie haben sich mit den kreativen Möglichkeiten von GenAI Chatbots befasst. Abseits davon eröffnen die sprachlichen Fähigkeiten dieser Technologie auch Anwendungsfälle im Bereich der Datenverarbeitung.

GenAI wird beispielsweise von Amazon eingesetzt, um Kundenrezensionen zu aggregieren und Highlights daraus direkt auf der Produktseite anzuzeigen https://www.aboutamazon.com/news/amazon-ai/amazon-improves-customer-reviews-with-generative-ai. Für den Finanzsektor wird erwartet, dass diese Technologie zukünftig große Mengen an Daten zusammenzufasst und somit Investmententscheidungen unterstützt https://link.springer.com/article/10.1007/s11846-023-00696-z. In der Forschung wird GenAI erprobt, um qualitative Inhaltsanalyse durchzuführen https://journals.sfu.ca/jalt/index.php/jalt/article/view/1585/753, wenn auch unter Vorbehalt ethischer und akademischer Bedenken https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10844801/. In diesem vierten Beitrag unserer Serie wollen wir uns daher der Fähigkeit von GenAI Chatbots widmen, Daten zu aggregieren. Wir richten uns dabei wie schon bisher an kleine Unternehmen, die den Einsatz von GenAI ohne Investition verproben wollen.

Bevor wir fortfahren, rufen wir wie üblich zur Vorsicht: Bei der Verwendung von Chatbot-Services gelten zwei Verhaltensgrundsätze:

  1. Geben Sie niemals vertrauliche oder sensible Informationen an Chatbots weiter. Ihre Eingaben können in Trainingsdaten oder Auswertungen landen und von anderen Benutzern abgerufen werden.
  2. Kontrollieren Sie GenAI Texte hinsichtlich deren Plausibilität und Angemessenheit. GenAI Chatbots sind keine Fachexperten. Sie erfinden Dinge, die weder der Realität noch Ihren Anforderungen entsprechen.

Fragen zu langen Dokumenten beantworten

GenAI bietet also die Möglichkeit, Daten schnell und einfach zu aggregieren. Nun stellt sich die Frage, wie auch ein kleines Unternehmen dies im praktischen Alltag nutzen kann, wenn doch vermieden werden soll, vertrauliche und sensible Daten an den Chatbot weiterzugeben. Ein Beispiel dafür liefern wir im Folgenden.

Anwendungsfall: Fragen aus einem Förderleitfaden beantworten

Lassen Sie uns zu unserem fiktiven Unternehmen "GreenGrow" zurückkehren, das wir im zweiten Beitrag unserer Serie eingeführt haben. GreenGrow wägt derzeit ab, mit dem Thema Fassadenbegrünung einen neuen Markt für sich zu erschließen. Um die Relevanz ihres vorhandenen Know-Hows abschätzen zu können, wollen die Mitarbeiter zuerst in Erfahrung bringen, welche Pflanzen überhaupt für die Begrünung von Fassaden eingesetzt werden.

Dazu verwendet das Team von GreenGrow den Leitfaden der Stadt Wien (pdf, 17,5 MB) – mit einem Umfang von 136 Seiten ein stattliches Dokument. Um die Frage schnell und gezielt beantworten zu können, stellen die Kollegen folgenden Prompt an ChatGPT und laden das Dokument als Anhang hoch:

Im Anhang findest du den Leitfaden der Stadt Wien für Fassadenbegrünung. Basierend auf diesem Dokument, welche Pflanzen eignen sich für die Begrünung von Fassaden? Beschränke deine Antwort darauf, die Pflanzenarten in einer Liste aufzuzählen. Gib als Referenz jeweils die Seitenzahl an, auf der du die Informationen gefunden hast. Erfinde keine Informationen, die nicht im verlinkten Dokument enthalten sind.

Folgendermaßen fällt die Antwort von ChatGPT auf diesen Prompt aus: Eine Liste von Pflanzen, die für Fassadenbegrünung geeignet sind, aggregiert von ChatGPT basierend auf einem umfangreichen PDF.

Durch die verweise auf die Seitenzahlen fällt es GreenGrow leicht, die Richtigkeit der von ChatGPT aggregierten Informationen zu prüfen und selbst im Dokument nachzulesen.

Informationen im Internet suchen und aggregieren

Eine andere Form der Datenverarbeitung durch GenAI hält im Bereich der Internetsuche Einzug. Alle großen Anbieter von Internetsuchmaschinen haben GenAI integriert, um relevante Informationen auf der Ergebnisseite zusammenzufassen:

  • Microsoft hat Bing bereits früh im Jahr 2023 als"AI-powered" neu vermarktet https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/.
  • Google hat "AI Overviews" für bestimmte Benutzergruppen aktiviert https://www.techradar.com/pro/the-genai-era-of-search-who-will-take-the-lead.
  • DuckDuckGo hat "DuckAssist" eingeführt https://spreadprivacy.com/duckassist-launch/.

Abgesehen davon gibt es GenAI Chatbots, die sich auf die Recherche im Internet spezialisiert haben: Perplexity, Andi, You oder bald auch SearchGPT https://openai.com/index/searchgpt-prototype/.

Dieser Einsatz von GenAI stellt der traditionellen, schlagwortbasierten Suche ein neues Paragdigma gegenüber: Informationen werden nicht mehr gesucht, sondern erfragt https://www.forbes.com/councils/forbestechcouncil/2024/06/11/the-ask-era-how-generative-ai-is-reshaping-the-future-of-search/. Der Frage nach den Auswirkungen eines möglichen Paradigmenwechsels werden wir uns im nächsten und letzten Beitrag dieser Serie widmen. Nun wollen wir uns möglichen praktischen Anwendungen der Internetsuche für das fiktive Unternehmen GreenGrow zuwenden.

Anwendungsfall: Förderprogramme suchen

Nachdem sich das Team von GreenGrow vergewissert hat, dass ihr Know How grundsätzlich auf die Begrünung von Fassaden anwendbar ist, möchten sie sich auch zu weiteren Fördermöglichkeiten für die Begrünung von Fassaden informieren. Dazu bemühen sie Perplexity mit folgendem Prompt:

Welche Förderungen gibt es in Wien, die ähnlich sind wie jene für Fassadenbegrünung? Antworte ausschließlich mit einer Liste an ähnlichen Förderungen und jeweils einem Satz, der die Förderung beschreibt.

Das Ergebnis ist im untestehenden Screenshot dargestellt.

Eine von Perplexity.ai zusammengestellte Liste von Förderprogrammen, inklusive Referenzen.

Abschluss und Ausblick

Abschließend halten wir es für besonders wichtig, im Kontext der Internetrecherche nochmals auf die Einschränkungen von GenAI hinzuweisen. Denn alle naturgemäßen Nachteile von GenAI hinsichtlich faktischer Information treffen auch hier zu: sie erfindet Informationen, gibt selten zu, dass sie etwas nicht weiß und verstärkt Vorurteile https://arxiv.org/pdf/2402.11707. Hinzu kommt noch, dass die Herkunft von Informationen in AI generierten Ergebnissen schwer nachvollziehbar ist und Referenzen oft falsch sind https://arxiv.org/pdf/2304.09848. In unserer persönlichen Erfahrung ist die Qualität der Ergebnisse, die wir durch Internetrecherche mit GenAI erzielt haben, eher bescheiden - eine Gegenüberstellung und strukturierte Bewertung würde jedoch den Umfang dieses Artikels sprengen.

Den problematischen Einschränkungen zum Trotz scheint sich die Einbindung von GenAI zu einem festen Bestandteil der Internetrecherche zu entwickeln. Wir hoffen, dass wir Ihnen mit dem vorliegenden Artikel einen kleinen Einblick in dieses aufkommende Thema geben konnten und dass Ihnen unsere Beispiele eine Idee zur praktischen Anwendung vermittelt haben.

Im nächsten und letzten Teil unserer Serie werden wir uns herausnehmen, eine Conclusio zu „GenAI für kleine Unternehmen" zu formulieren und das Thema aus unserer Sicht zu kommentieren. Darauf freuen wir uns ganz besonders – bis zum nächsten Mal!