Laura Stern
8.12.2021
Gesundheitliche Risiken wie Bluthochdruck, Herzleiden, Diabetes oder Schlaganfälle aufgrund schlechter Ernährung mit zu viel Zucker, Fette und Salz – vor allem in Fertigprodukten, ist in Deutschland keine Seltenheit.
Mit der Zielsetzung, Verbraucher*innen bei einer gesunden Ernährung – insbesondere Kinder und Jugendliche – zu unterstützen und dadurch die verarbeiteten Lebensmittel gesünder werden zu lassen, wurde die Nationale Reduktions- und Innovationsstrategie für Zucker, Fette und Salz in Fertigprodukten (NRI) durch das Bundesministerium für Ernährung und Landwirtschaft (BMEL) initiiert. Dazu haben sich Akteuere der Lebensmittelwirtschaft verpflichtet, bis zum Jahre 2025 definierte Reduktionsziele zu erreichen.
Als zentrales Instrument der NRI dient ein umfangreiches Produktmonitoring des Max Rubner-Instituts (MRI) dazu, die Umsetzung der Vereinbarungen mit der Lebensmittelwirtschaft zu überprüfen. In jährlichen Erhebungen werden Energie- und Nährstoffgehalte ausgewählter Produktgruppen erfasst und über den Zeitverlauf beobachtet. Darüber hinaus weist das Institut auf einen Nachregulierungs- oder weiteren Handlungsbedarf hin.
Die Sicherstellung eines vollumfassenden Produktmonitorings, welches Änderungen der Produktdaten erfasst, validiert und dokumentiert, ist aktuell ohne technische Unterstützung mit einem erheblichen, vor allem personellen Aufwand, verbunden. Im Rahmen des RePro-Projekts wird daran gearbeitet, die derzeitige manuell durchgeführte Arbeit durch eine vollautomatisierte, KI-getriebene Produktmonitoring-Lösung zu substituieren. Ziel ist es, durch ein Zusammenspiel verschiedener Komponenten (siehe Abbildung 1), Veränderungen der Zutaten und Nährwerte von industriell erzeugten Lebensmitteln automatisiert aufzufinden, mittels Künstlicher Intelligenz (KI) auszuwerten und visuell verständlich aufzubereiten.
Die Produkte werden auf diversen Herstellerwebseiten und Onlineshops durch einen Crawler gefunden und gespeichert. Die KI-Analyse bereitet die Daten systematisch auf, aggregiert und vergleicht sie mit historischen Werten, wodurch die Abweichungen automatisiert gemeldet werden und Zutaten- und Nährstoffänderungen für Verbraucher visualisiert werden können.
Das Forschungsprojekt baut auf einem breiten Repertoire von maschinellen Extraktionstechnologien auf. Informationsextraktion aus Text wie Entitäten und Sentiment wird heute durch verschiedenste Open-Source-Tools, wie z.B. StanfordNLP oder SpaCy oder kommerzielle Software unterstützt, die jedoch meist grammatikalisch korrekte, längere Texte mit ausreichend Kontext voraussetzen. Typisch für Online-Inhalte sind jedoch kurze Texte mit schlechter Grammatik. Ebenso werden die Algorithmen mit Daten der Lebensmitteldomäne trainiert. Insbesondere durch Maschinelle Lernverfahren haben sich Techniken im Bereich der Erkennung von Objekten in Bildern stark verbessert. So hat elevait ein Verfahren entwickelt, um mittels Computer-Vision-Algorithmen strukturierte Daten aus Dokumenten wie Rechnungen oder Gutachten im PDF oder Bildformat zu extrahieren. Im Rahmen des Projektes werden die Algorithmen so verbessert, dass anhand von Produktabbildungen und -beschreibungen z.B. Biosiegel oder an Kinder gerichtetes Produktdesign erkannt werden. Um die extrahierten Informationen der heterogenen Quellen in ein einheitliches Datenmodell zu transformieren und in einer für Mehrwertdienste und -anwendungen leicht wiederverwendbaren Form zur Verfügung zu stellen, eignen sich besonders Graph-basierte Datenmodelle dank ihrer flexiblen und erweiterbaren Struktur, insbesondere das W3C-standardisierte Ressource Description Framework (RDF). Die aus einer Quelle gewonnenen RDF-Beschreibungen (bspw. von Produkten) können somit vereinfacht mit Beschreibungen derselben Dinge aus anderen Quellen vernetzt werden (Linking). In Verbindung mit den Linked-Data-Prinzipien ermöglicht RDF eine Beschreibung von Daten, die diese für Entwickler von Diensten und Anwendungen besonders leicht aufrufbar und wiederverwendbar (SPARQL) macht. Die Schemata (Ontologien) solcher Wissensgraphen basieren meist auf standardisierten Terminologien; sie können um ausdrucksstarke logische Schlussfolgerungs-Regeln erweitert werden.
Im Bereich der Datenanalyse werden drei verschiedene Machine Learning Verfahren benötigt:
1. Ausgangspunkt für die Bereinigung und das Zusammenführen von Daten sind Clustering-Methoden, die basierend auf hochdimensionalen Vektoren Ähnlichkeiten identifizieren.
2. Um gefunden Produkte zu 1 bis n Klassen hinzufügen zu können, werden Klassifikationsalgorithmen eingesetzt. Neben herkömmlichen Verfahren werden für beide Probleme heute zunehmend neuronale Netze / Deep Learning verwendet. Ähnliches gilt für
3. Regressionsverfahren zur Vorhersage nummerischer Daten, meist auf den Zeitachsen. Auch wenn es heute sehr viele Algorithmen gibt, die teils auch in Open-Source-Frameworks wie scikit-learn implementiert sind, ist eine wesentliche Herausforderung, für ein Problem den passenden Algorithmus zu finden und korrekt zu parameterisieren. Hierzu hat elevait eine Software entwickelt, die unterstützt, passende Konfigurationen zu identifizieren.
Nachhaltigkeit und KI-Technologie Hand in Hand - das gilt als zukunftsträchtig. Wir geben Antwort, wie Künstliche Intelligenz Unterstützung bietet bei der Verfolgung von ökologischen, ökonomischen und sozialen Zielen der Nachhaltigkeit für Unternehmen.
mehr lesen...Der EU-AI-Act ist in Kraft getreten. Konkret bedeutet das viele Änderungen für Firmen, die im Bereich KI tätig sind oder mit KI arbeiten. Welche Anpassungen sind bis wann notwendig? Alle relevanten Informationen für Unternehmen rundum den EU-AI-Act.
mehr lesen...Digitale Rechnungsverarbeitung nutzt KI, um Rechnungen effizient zu erfassen, Daten automatisch zu extrahieren und in Systeme zu übertragen. Doch was sind die Vorteile und wieso sollte man digitale Rechnungsverarbeitung nutzen?
mehr lesen...