Das Forschungsprojekt RePro steht für das Reduktions-Produktmonitoring von Zucker, Fetten und Salz in Fertigprodukten und schafft im Rahmen der Nationalen Reduktions- und Innovationsstrategie ein System zur automatisierten Erkennung von Inhaltsstoffen.

🥙

Gesundheitliche Probleme wie Bluthochdruck, Herzleiden, Diabetes oder Schlaganfälle aufgrund schlechter Ernährung mit zu viel Zucker, Fett und Salz – vor allem in Fertigprodukten – sind in Deutschland keine Seltenheit.

Mit der Zielsetzung, Verbraucher*inneninsbesondere Kinder und Jugendliche – bei einer gesunden Ernährung zu unterstützen und dadurch gesündere Lebensmittel zu fördern, wurde die Nationale Reduktions- und Innovationsstrategie für Zucker, Fette und Salz in Fertigprodukten (NRI) durch das Bundesministerium für Ernährung und Landwirtschaft (BMEL) initiiert. Dazu haben sich Akteure der Lebensmittelwirtschaft verpflichtet, bis zum Jahre 2025 definierte Reduktionsziele zu erreichen.

Als zentrales Instrument der NRI dient ein umfangreiches Produktmonitoring des Max Rubner-Instituts (MRI) dazu, die Umsetzung der Vereinbarungen mit der Lebensmittelwirtschaft zu überprüfen. In jährlichen Erhebungen werden Energie- und Nährstoffgehalte ausgewählter Produktgruppen erfasst und über den Zeitverlauf beobachtet. Darüber hinaus weist das Institut auf einen Nachregulierungs- oder weiteren Handlungsbedarf hin.

Die Sicherstellung eines vollumfassenden Produktmonitorings, welches Änderungen der Produktdaten erfasst, validiert und dokumentiert, ist aktuell ohne technische Unterstützung mit einem erheblichen, vor allem personellen, Aufwand verbunden. Im Rahmen des RePro-Projekts wird daran gearbeitet, die derzeitig manuell durchgeführte Arbeit durch eine vollautomatisierte, KI-getriebene Produktmonitoring-Lösung zu ersetzen.

Ziel ist es, durch ein Zusammenspiel verschiedener Komponenten – (siehe Abbildung 1) – Veränderungen der Zutaten und Nährwerte von industriell erzeugten Lebensmitteln automatisiert aufzufinden, mittels künstlicher Intelligenz (KI) auszuwerten und visuell verständlich aufzubereiten.

Abbildung 1: Komponenten des RePro- Projekts

Technische Umsetzung des Projekts

Die Produkte werden auf Herstellerwebseiten und Onlineshops durch einen Crawler gefunden und gespeichert. Die KI-Analyse bereitet die Daten systematisch auf, aggregiert und vergleicht sie mit historischen Werten, wodurch die Abweichungen automatisiert gemeldet werden und Veränderungen der Energie- und Nährstoffgehalte für Verbraucher visualisiert werden können.

Screenshot vom Rewe Onlineshop

"edm:productOrServiceTitle": "ja! Weisse Schokolade 100g"

"edm:organizationName": "Karina Schokoladen Vertrieb GmbH"

"ddm-repro:ingredientText": "Zucker, Kakaobutter, VOLLMILCHPULVER 22%, MILCHZUCKER, SAHNEPULVER (MILCH) 3%, SUESSMOLKENPULVER (MILCH), Emulgator SOJALECITHINE, Vanilleextrakt."

Technischer Hintergrund der KI

Das Forschungsprojekt baut auf einem breiten Repertoire von maschinellen Extraktionstechnologien auf. Informationsextraktion aus Text wie Entitäten und Sentiment wird heute durch verschiedenste Open-Source-Tools, wie z.B. StanfordNLP oder SpaCy, oder kommerzielle Software unterstützt, die jedoch meist grammatikalisch korrekte, längere Texte mit ausreichend Kontext voraussetzen. Typisch für Online-Inhalte sind jedoch kurze Texte mit schlechter Grammatik. Weiterhin werden die Algorithmen mit Daten der Lebensmitteldomäne trainiert. Insbesondere durch maschinelle Lernverfahren haben sich Techniken im Bereich der Erkennung von Objekten in Bildern stark verbessert. So hat elevait ein Verfahren entwickelt, um mittels Computer-Vision-Algorithmen strukturierte Daten aus Dokumenten wie Rechnungen oder Gutachten im PDF oder Bildformat zu extrahieren. Im Rahmen des Projektes werden die Algorithmen so verbessert, dass anhand von Produktabbildungen und -beschreibungen z.B. Biosiegel oder an Kinder gerichtetes Produktdesign erkannt werden. Um die extrahierten Informationen der heterogenen Quellen in ein einheitliches Datenmodell zu transformieren und in einer für Mehrwertdienste und -anwendungen leicht wiederverwendbaren Form zur Verfügung zu stellen, eignen sich besonders graphbasierte Datenmodelle. Dank ihrer flexiblen und erweiterbaren Struktur, hier insbesondere das W3C-standardisierte Ressource Description Framework (RDF), eignen sich diese Datenmodelle sehr gut für derartige Anwendungsfälle. Die aus einer Quelle gewonnenen RDF-Beschreibungen (bspw. von Produkten) können somit einfacher mit Beschreibungen derselben Dinge aus anderen Quellen vernetzt werden (Linking). In Verbindung mit den Linked-Data-Prinzipien ermöglicht RDF eine Beschreibung von Daten, die diese für Entwickler von Diensten und Anwendungen besonders leicht aufrufbar und wiederverwendbar (SPARQL) macht. Die Schemata (Ontologien) solcher Wissensgraphen basieren meist auf standardisierten Terminologien; sie können um ausdrucksstarke logische Schlussfolgerungs-Regeln erweitert werden.

Im Bereich der Datenanalyse werden drei verschiedene Machine-Learning -Verfahren angewandt:

1. Ausgangspunkt für die Bereinigung und das Zusammenführen von Daten sind Clustering-Methoden, die basierend auf hochdimensionalen Vektoren Ähnlichkeiten identifizieren.

2. Um gefunden Produkte zu 1 bis n Klassen hinzufügen zu können, werden Klassifikationsalgorithmen eingesetzt. Neben herkömmlichen Verfahren werden für beide Probleme heute zunehmend neuronale Netze / Deep Learning verwendet. Ähnliches gilt für

3. Regressionsverfahren zur Vorhersage nummerischer Daten, meist auf den Zeitachsen. Auch wenn es heute sehr viele Algorithmen gibt, die teils auch in Open-Source-Frameworks wie scikit-learn implementiert sind, ist eine wesentliche Herausforderung, für ein Problem den passenden Algorithmus zu finden und korrekt zu parameterisieren. Hierzu hat elevait eine Software entwickelt, die unterstützt, passende Konfigurationen zu identifizieren.

🚀

Diese State-of-the-Art-Technologien implizieren einen effizienten und ressourcenschonenden Einsatz in der gelebten Praxis. Damit trägt RePro maßgeblich zum Erfolg und zur Akzeptanz der Nationalen Reduktions- und Innovationsstrategie für Zucker, Fette und Salz in Fertigprodukten bei.

Ansprechpartnerin
SANDY CSISKO

* Pflichtfeld