Was ist eine Bilderkennung?
Eine Bilderkennung ist die Fähigkeit eines Computers, Merkmale in einem Bild zu erkennen. Mit anderen Worten, sie bezieht sich auf die Extraktion von digitalen Datenmerkmalen aus einem aufgenommenen Bild und die Erstellung eines Algorithmus auf der Grundlage subjektiver menschlicher Beurteilungen oder menschlicher Kriterien, um automatisch Entscheidungen zu treffen.
Die Technologie der Bilderkennung ist in unserem täglichen Leben beispielsweise in Smartphone-Foto-Apps weit verbreitet. Die in Foto-Apps eingesetzte Technologie wird verwendet, um die Objekte auf einem Foto mithilfe der Gesichtserkennung zu kategorisieren und eine Liste ähnlicher Objekte anzuzeigen.
Wir nutzen auch soziale Medien, in denen die Textanalyse als Grundfunktion in sozialen Medien eingesetzt wird. Auch die Bilderkennung wird in den sozialen Medien immer wichtiger.
Das liegt daran, dass die Bilderkennung bei der Analyse sozialer Medien als eine Erweiterung der Textanalysefunktionalität für visuelle Inhalte betrachtet wird.
Künstliche Intelligenz, einschließlich des maschinellen Lernens, hat sich seit dem Aufkommen der KI in den späten 1960er Jahren weiterentwickelt. Heute kann diese Technologie eingesetzt werden, um automatisch Entscheidungen zu treffen, indem Informationen aus Bildern und gegebenen Informationen extrahiert werden.
Einführung der Bilderkennung
Ein Beispiel für die Einführung der Bilderkennung ist die Entwicklung von Testverfahren für Chromosomenaberrationen.
Der Chromosomenaberrationstest ist eine Testmethode, bei der kultivierte Zellen verwendet werden, um die Induzierbarkeit von strukturellen und numerischen Chromosomenaberrationen durch chemische Substanzen zu untersuchen und so die frühen Stadien der Krebsentstehung vorherzusagen.
Screening-Tests mit Mikroorganismen werden häufig zum Nachweis von Mutagenen und Karzinogenen in natürlichem Wasser und Trinkwasser eingesetzt. Um das Risiko für den Menschen quantitativ bewerten zu können, ist es jedoch wünschenswert, Säugetiere zu testen.
Durch die Verwendung von Säugetierzellkulturen als einfache Testmethode kann daher auch die Sicherheit berücksichtigt werden.
Da es außerdem von großer Bedeutung ist, Chromosomenaberrationstests mit Säugetierkulturzellen durchzuführen, wird in der Forschung die Bilderkennung der Chromosomenvermehrung eingesetzt, um Aberrationen zu erkennen und die Testergebnisse zu objektivieren.
Die Technologie der Bilderkennung hat sich zwar stark weiterentwickelt, aber die zu ihrer Anwendung erforderlichen Analysemethoden haben damit nicht Schritt gehalten.
Diese Forschung ist daher äußerst wichtig, um die Methoden der Bilderkennung voranzutreiben.
Die Studie ist in Proc. of Environ. & Sani. Eng. Research, Vol. 26, 1990 (Proc. of Environ. & Sani. Eng. Research,Vol. 26, 1990) beschrieben.
Vor- und Nachteile der Bilderkennung
Zu den Vorteilen der Bilderkennung gehören die Steigerung der Produktivität, die Verbesserung der Arbeitsbedingungen und die Senkung der Arbeitskosten. Wird die Bilderkennung beispielsweise in die Inspektion integriert, kann sie fehlerhafte Teile und andere Defekte ohne den Einsatz des menschlichen Auges erkennen.
Zusätzlich zur Bilderkennung können Sortiermaschinen und -roboter gekoppelt werden, um Prüfstücke automatisch auszusortieren.
So können Inspektionen auch während langer Arbeitszeiten oder in gefährlichen Umgebungen durchgeführt werden, was zur Sicherheit am Arbeitsplatz beiträgt.
Darüber hinaus werden Qualitätsmängel, die durch menschliches Versagen verursacht werden verringert und es wird weniger Aufwand betrieben, um Qualitätsmängel, die das menschliche Auge übersehen hat, später noch einmal zu überprüfen.
Zu den Nachteilen der Bilderkennung gehören jedoch die Kosten für die Ausrüstung zur Durchführung der Bilderkennung und der Mangel an Softwareanwendungen.
Für die Bilderkennung werden Kameras, Sensoren und Monitore benötigt, was zu hohen Anschaffungskosten führt. Da es sich bei der Bilderkennung um eine noch in der Entwicklung befindliche Technologie handelt, kann es außerdem schwierig sein, die richtige Software und die richtigen Anwendungen für diese Aufgabe zu finden.
Da es sich jedoch um einen Bereich handelt, der sich wahrscheinlich weiter entwickeln wird, ist es notwendig, die Verfügbarkeit von Produkten, die für Ihre Bedürfnisse geeignet sind, genau zu beobachten.
Methoden und Arten der Bilderkennung
Es gibt drei Hauptkategorien typischer Bilderkennungsmethoden: Bildklassifizierung, Objekterkennung und Bildsegmentierung.
- Bildklassifizierung
Die Bildklassifizierung bezieht sich auf Methoden, mit denen sich die Inhalte des betreffenden Bildes unterscheiden und in Kategorien einteilen lassen. In Bildern und Fotografien sind verschiedene Informationen enthalten, die zur Klassifizierung von Bildern verwendet werden, indem Merkmale aus dem Rasterbild extrahiert werden. So kann beispielsweise ein Raum in einem einzigen Bild erkannt werden, indem die Maschine ihn als Hund, Katze, Mensch, Himmel, Baum usw. speichert.
- Objekterkennung
Die Objekterkennung ist eine Methode zur Erkennung von Objekten, die sich ähnlich wie die Bildklassifizierung verhält. Darüber hinaus führt die Objekterkennung jedoch auch Operationen durch, um den Bereich des Objekts einzugrenzen und andere Objekte als das zu erkennende abzustoßen. Während die Bildklassifizierung auf ein einzelnes Objekt in einem Bild abzielt, kann die Objekterkennung auch mehrere Objekte erfassen.
- Bildsegmentierung
Bei der Bildsegmentierung handelt es sich um eine Methode zur Bestimmung eines bestimmten Bildbereichs. Diese Methode funktioniert in der Regel durch die Kombination mehrerer Techniken. Um die Zuverlässigkeit der unterschiedenen Regionen zu gewährleisten, ist zum Beispiel ein Markierungsprozess erforderlich, der als Annotation bezeichnet wird. Bei der Annotation handelt es sich um eine Methode zur Unterscheidung, bei der Objekte mit Informations-Tags versehen werden, indem Metadaten an bestimmte Informationen angehängt werden.
Es gibt auch zwei Arten von Techniken zur Bilderkennung:
- Gesichtserkennung
Die Gesichtserkennung ist eine Technologie, die es einem Computer ermöglicht, die Gesichtszüge einer Person zu extrahieren und zu identifizieren. Beim Vergleich der Informationen über ein in einer Datenbank registriertes Gesicht mit den Informationen über ein von einem Sensor erfasstes Gesicht wird eine Technologie namens Gesichtserkennung eingesetzt. In den letzten Jahren ist es möglich geworden, nicht nur menschliche Gesichter, sondern auch Tiergesichter zu erkennen. Darüber hinaus wird an einer Technologie zum Lesen von Gesichtsausdrücken, der so genannten Emotionserkennung, geforscht.
- Zeichenerkennung
Bei der Zeichenerkennung handelt es sich um eine Technologie zum Lesen und Identifizieren von Zeichen auf papierbasierten Dokumenten. Im Allgemeinen wird Text als Zeichendaten erfasst, indem ein Scanner zum Lesen des Textes verwendet oder der Text mit einer Kamera aufgenommen wird. Die erfassten Zeichendaten werden in Textdaten umgewandelt, die dann für Übersetzungsfunktionen oder zur Überprüfung von Zeichenunterschieden verwendet werden.
Beziehung zwischen KI und Bilderkennung
KI, auch künstliche Intelligenz genannt, ist ein System, in dem ein Computer menschenähnliche intellektuelle Tätigkeiten ausführt, die den Mechanismen des menschlichen Gehirns nachempfunden sind. Diese Mechanismen können mit der Bilderkennung kombiniert werden, um mehr Sicherheit zu erhalten.
Je nach Bedarf finden verschiedene Arten der KI-gestützten Bilderkennung immer mehr Verbreitung. Dieses Thema beschreibt gängige Bilderkennungsmethoden und erklärt, wie sie eingesetzt werden.
Um KI einsetzen zu können, müssen die Bilddaten zunächst aufbereitet werden und man muss lernen, was man erkennen möchte. Denn die Bilderkennung durch KI kann nur dann feststellen, dass etwas vorhanden ist, wenn sie das Ziel identifizieren kann.
Und obwohl die Anzahl der Bilder, aus denen die Merkmale des Ziels gelernt werden sollen, groß sein sollte, ist es möglich, die Anzahl der Bilder durch Vergrößern, Verkleinern oder Drehen der Bilder zu erhöhen, wenn die Anzahl der Bilder klein ist.
Darüber hinaus erhöht die Angabe von mehr als einem zu lernenden Merkmal die Genauigkeit. Wenn beispielsweise nur Ohren als Merkmal gelernt werden, erkennt das System zwar Objekte mit Ohren, kann aber nicht bestimmen, um welche Art von Ohren es sich handelt.
Die Erkennungsrate wird dann durch eine Methode namens Faltung bestimmt. Die Faltung unterteilt das Bild in mehrere Quadranten und bestimmt numerisch, wie genau die Trefferquote innerhalb dieser Quadranten im Vergleich zum Merkmal ist.
Nach dem Erlernen der Merkmale werden die Merkmale mit einer Methode namens Pooling zusammengefasst, indem das Merkmal mit dem höchsten numerischen Wert unter den Faltungen ausgewählt wird.
Schließlich werden die Erkennungsrate und die Übereinstimmungsrate der Merkmale bestimmt und die Leistung bewertet. Wenn hier keine guten Ergebnisse erzielt werden, wird die oben beschriebene Methode aktualisiert.
Anwendungen der Bilderkennung
Die Bilderkennung wird als Mittel zur Entwicklung von Bildanalysetechniken für Risse in Beton am Beispiel der Gabor-Wavelet-Transformation eingesetzt. Die Gabor-Wavelet-Transformation ist ein mathematisches Werkzeug zur Analyse von Daten. Risse in Betonstrukturen werden durch visuelle Beobachtungsinspektionen untersucht.
Diese Untersuchungsmethode führt jedoch zu unterschiedlichen Beurteilungen durch die Inspektoren, was die Objektivität und Quantität aufgrund von Unkenntnis beeinträchtigt. Daher hat der Bedarf an effizienteren, automatisierten und digitalen Inspektionsbesichtigungen zu Forschungen mit digitaler Bildverarbeitung geführt.
Um Methoden dieser Bildverarbeitung zu etablieren, sind hochpräzise Risserkennungsmethoden und Verarbeitungsaufgaben unerlässlich.
Um dies zu erreichen, wurden Verbesserungen an der bestehenden Methode der Bilderkennung unter Verwendung der 2D-Gabor-Wavelet-Transformation vorgenommen, die sich für Risse in realen Strukturen als wirksam erwiesen hat.
Diese Forschung wird in JSCE Transactions E2 (Materials and Concrete Structures), Vol. 68, No. 3,178-194,2012 beschrieben.178
Die Bilderkennung wurde auch für andere Anwendungen der Partikelanalyse verwendet, um die Anzahl der Partikel, den Partikeldurchmesser, die Umfangsverteilung und den Partikelbruch von Materialien wie Keramik, Harzen und Metallen zu messen.