[go: up one dir, main page]

DE102019211672A1 - Training method for an artificial neural network - Google Patents

Training method for an artificial neural network Download PDF

Info

Publication number
DE102019211672A1
DE102019211672A1 DE102019211672.8A DE102019211672A DE102019211672A1 DE 102019211672 A1 DE102019211672 A1 DE 102019211672A1 DE 102019211672 A DE102019211672 A DE 102019211672A DE 102019211672 A1 DE102019211672 A1 DE 102019211672A1
Authority
DE
Germany
Prior art keywords
data set
neural network
artificial neural
trained
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102019211672.8A
Other languages
German (de)
Inventor
Mark Schutera
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZF Friedrichshafen AG
Original Assignee
ZF Friedrichshafen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZF Friedrichshafen AG filed Critical ZF Friedrichshafen AG
Priority to DE102019211672.8A priority Critical patent/DE102019211672A1/en
Publication of DE102019211672A1 publication Critical patent/DE102019211672A1/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

Trainingsverfahren für ein künstliches neuronales Netzwerk, welches eingerichtet ist, aufgrund von Eingangsdaten Ausgangsdaten zu ermitteln, mit den folgenden Schritten: Bereitstellen eines Ausgangstrainingsdatensatzes, welcher mit Informationen versehen ist, sowie eines künstlichen neuronalen Netzwerks, welches mittels des Ausgangstrainingsdatensatzes trainiert wurde; Bereitstellen eines Zieldatensatzes, welcher sich hinsichtlich einer Charakteristik von dem Ausgangstrainingsdatensatz unterscheidet; Trainieren des künstlichen neuronalen Netzwerks mittels des Zieldatensatzes.Training method for an artificial neural network, which is set up to determine output data on the basis of input data, with the following steps: providing an output training data set which is provided with information, and an artificial neural network which was trained using the output training data set; Providing a target data set which differs from the initial training data set with regard to a characteristic; Training the artificial neural network using the target data set.

Description

GEBIET DER ERFINDUNGFIELD OF THE INVENTION

Die vorliegende Erfindung betrifft ein Trainingsverfahren für ein künstliches neuronales Netzwerk sowie ein Fahrerassistenzsystem mit einem künstlichen neuronalen Netzwerk.The present invention relates to a training method for an artificial neural network and a driver assistance system with an artificial neural network.

ZUSAMMENFASSUNG DER ERFINDUNGSUMMARY OF THE INVENTION

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, den Aufwand eines Trainings für ein künstliches neuronales Netzwerk zu verringern.The present invention is based on the object of reducing the effort involved in training an artificial neural network.

Erfindungsgemäß wird diese Aufgabe durch ein Trainingsverfahren für ein künstliches neuronales Netzwerk mit den Merkmalen des Patentanspruchs 1 gelöst.According to the invention, this object is achieved by a training method for an artificial neural network with the features of claim 1.

Demgemäß ist vorgesehen:

  • - ein Trainingsverfahren für ein künstliches neuronales Netzwerk, welches eingerichtet ist, aufgrund von Eingangsdaten Ausgangsdaten zu ermitteln, mit den folgenden Schritten: Bereitstellen eines Ausgangstrainingsdatensatzes, welcher mit Informationen versehen ist, sowie eines künstlichen neuronalen Netzwerks, welches mittels des Ausgangstrainingsdatensatzes trainiert wurde; Bereitstellen eines Zieldatensatzes, welcher sich hinsichtlich einer Charakteristik von dem Ausgangstrainingsdatensatz unterscheidet; Trainieren des künstlichen neuronalen Netzwerks mittels des Zieldatensatzes.
Accordingly, it is provided:
  • a training method for an artificial neural network which is set up to determine output data on the basis of input data, with the following steps: providing an output training data set which is provided with information, and an artificial neural network which was trained using the output training data set; Providing a target data set which differs from the initial training data set with regard to a characteristic; Training the artificial neural network using the target data set.

Ein künstliches neuronales Netzwerk (KNN, englisch artificial neural network - ANN) ist insbesondere ein in einem Rechenprogramm nachgebildetes Netzwerk aus vernetzten künstlichen Neuronen. Die künstlichen Neuronen sind dabei typischerweise auf verschiedenen Schichten (layers) angeordnet. Üblicherweise umfasst das künstliche neuronale Netzwerk eine Eingangsschicht und eine Ausgabeschicht (output layer), deren Neuronenausgabe als einzige des künstlichen neuronalen Netzwerks sichtbar wird. Zwischen der Eingangsschicht und der Ausgabeschicht liegende Schichten werden typischerweise als verdeckte Schichten (hidden layer) bezeichnet. Typischerweise wird zunächst eine Architektur bzw. Topologie eines künstlichen neuronalen Netzwerks initiiert und dann in einer Trainingsphase für eine spezielle Aufgabe oder für mehrere Aufgaben in einer Trainingsphase trainiert.An artificial neural network (ANN) is in particular a network of networked artificial neurons, which is simulated in a computer program. The artificial neurons are typically arranged on different layers. The artificial neural network usually comprises an input layer and an output layer, the neuron output of which is the only one of the artificial neural network that is visible. Layers lying between the input layer and the output layer are typically referred to as hidden layers. Typically, an architecture or topology of an artificial neural network is first initiated and then trained in a training phase for a special task or for several tasks in a training phase.

Das Training des künstlichen neuronalen Netzwerks umfasst dabei typischerweise eine Veränderung eines Gewichts einer Verbindung zwischen zwei künstlichen Neuronen des künstlichen neuronalen Netzwerks. Das Gewicht enthält Information zur Stärke der Berücksichtigung eines Eingangs eines Neurons. Das Training des künstlichen neuronalen Netzwerks kann auch eine Entwicklung von neuen Verbindungen zwischen künstlichen Neuronen, ein Löschen von bestehenden Verbindungen zwischen künstlichen Neuronen, ein Anpassen von Schwellwerten der künstlichen Neuronen und/oder ein Hinzufügen oder ein Löschen von künstlichen Neuronen umfassen.The training of the artificial neural network typically includes a change in the weight of a connection between two artificial neurons of the artificial neural network. The weight contains information on the strength of the consideration of an input of a neuron. The training of the artificial neural network can also include the development of new connections between artificial neurons, deleting existing connections between artificial neurons, adapting threshold values of the artificial neurons and / or adding or deleting artificial neurons.

Ein Trainingssystem ist eine Recheneinheit, auf welcher ein KNN trainiert wird.A training system is a computing unit on which an ANN is trained.

Trainingsdaten sind in dieser Anmeldung Datenpaare aus Eingangsdaten, die von dem KNN zu verarbeiten sind, sowie Soll-Ergebnisdaten, die von dem KNN zu ermitteln sind. Während des Trainings wird das KNN aufgrund eines Vergleichs von Soll-Ergebnisdaten mit dem von dem KNN ermittelten Ist-Ergebnisdaten angepasst, wodurch sich ein Trainingseffekt einstellt.In this application, training data are data pairs of input data that are to be processed by the ANN, as well as target result data that are to be determined by the ANN. During the training, the ANN is adapted on the basis of a comparison of target result data with the actual result data determined by the ANN, which results in a training effect.

Eine Möglichkeit künstliche neuronale Netze zu trainieren, ist die Fehlerrückführung. In der frühen Trainingsphase macht ein Netz Fehler. Zur Korrektur des Fehlers werden die Auslöser der Abweichungen (Fehler) zwischen erzeugter Zuordnung (Ist-Ausgangsdaten) und Lösungszuordnung (Soll-Ausgangsdaten) zurückverfolgt und wiederholt steuernde Faktoren (Gewichte) in den Schichten des Netzes jeweils so verändert, dass die Zuordnungsfehler kleiner werden.One possibility to train artificial neural networks is error feedback. A network makes mistakes in the early training phase. To correct the error, the triggers of the deviations (errors) between the generated assignment (actual output data) and solution assignment (target output data) are tracked and repeatedly controlling factors (weights) in the layers of the network are changed so that the assignment errors become smaller.

Ein Ausgangstrainingsdatensatz ist in dieser Anmeldung ein gelabelter Trainingsdatensatz, d.h. ein Trainingsdatensatz, der mit Informationen hinsichtlich semantischer Merkmale, die in den Daten enthalten sind, versehen ist.In this application, an initial training data record is a labeled training data record, i.e. a training data record which is provided with information with regard to semantic features that are contained in the data.

Gelabelte Daten bzw. Daten, die mit Informationen versehen sind, sind Datensätze, die mit einer oder mehreren Informationen versehen wurden. Dabei wird normalerweise ein Satz nicht gelabelter Daten verwendet, der mit aussagekräftigen Informationen ergänzt wird. Zum Beispiel können Labels angeben, ob ein Foto ein Pferd oder eine Kuh enthält, welche Wörter in einer Audioaufzeichnung gesprochen wurden, welche Art von Aktion in einem Video ausgeführt wird, welches Thema ein Nachrichtenartikel hat und wie die allgemeine Stimmung ist, etc.Labeled data or data that are provided with information are data records that have been provided with one or more pieces of information. Typically, a set of unlabeled data is used, supplemented with meaningful information. For example, labels can indicate whether a photo includes a horse or a cow, what words were spoken in an audio recording, what type of action is performed in a video, what is the subject of a news article and what the general mood is like, etc.

Labels werden oft durch Menschen generiert, z.B. indem Menschen über ein bestimmtes Stück unbeschrifteter Daten urteilen (z. B. „Enthält dieses Foto ein Pferd oder eine Kuh?“). Folglich sind gelabelte Daten erheblich teurer als unbeschriftete Rohdaten.Labels are often generated by humans, e.g. by humans judging a certain piece of unlabeled data (e.g. "Does this photo contain a horse or a cow?"). As a result, labeled data is considerably more expensive than unlabeled raw data.

In dieser Patentanmeldung ist ein Zieldatensatz ein Szenario, auf welches ein KNN ausgehend von einem Ausgangstrainingsdatensatz trainiert werden soll. Dementsprechend unterscheidet sich der Zieldatensatz in einer Charakteristik, also einer charakteristischen Eigenschaft, die allen Daten des Zieldatensatzes gemein ist, von dem Ausgangstrainingsdatensatz.In this patent application, a target data set is a scenario on which an ANN is to be trained on the basis of an initial training data set. Accordingly, the differs Target data set in a characteristic, that is to say a characteristic property that is common to all data of the target data set, of the initial training data set.

GAN (Generative Adversarial Networks) umfassen zwei künstliche neuronale Netzwerke, die ein Nullsummenspiel durchführen. Eines davon erstellt Kandidaten (der Generator), das zweite neuronale Netzwerk bewertet die Kandidaten (der Diskriminator). Typischerweise bildet der Generator von einem Vektor aus latenten Variablen auf den gewünschten Ergebnisraum ab. Das Ziel des Generators ist es, zu lernen, Ergebnisse nach einer bestimmten Verteilung zu erzeugen. Der Diskriminator wird hingegen darauf trainiert, die Ergebnisse des Generators von den Daten aus der echten, vorgegebenen Verteilung zu unterscheiden. Die Zielfunktion des Generators besteht dann darin, Ergebnisse zu erzeugen, die der Diskriminator nicht unterscheiden kann. Dadurch soll sich die erzeugte Verteilung nach und nach der echten Verteilung angleichen.GAN (Generative Adversarial Networks) are two artificial neural networks that perform a zero-sum game. One of them creates candidates (the generator), the second neural network evaluates the candidates (the discriminator). The generator typically maps a vector of latent variables to the desired result space. The goal of the generator is to learn to produce results according to a certain distribution. The discriminator, on the other hand, is trained to distinguish the results of the generator from the data from the real, given distribution. The generator's objective function is then to produce results that the discriminator cannot distinguish. As a result, the generated distribution should gradually adjust to the real distribution.

Der Abstand gibt einen Unterschied zwischen zwei Elementen einer Datenstruktur an. Ein einfaches Beispiel für ein Abstandsmaß ist der Abstand zwischen zwei Punkten. Ein Abstandsmaß lässt sich jedoch für jede Datenstruktur, die zumindest zwei vergleichbare Elemente aufweist, angeben.The distance indicates a difference between two elements of a data structure. A simple example of a distance measure is the distance between two points. However, a distance measure can be specified for every data structure that has at least two comparable elements.

Eine Abstandsrelation ordnet Elemente, hier Datensätze, einer Datenstruktur hinsichtlich des Betrags deren Charakteristik.A distance relation arranges elements, here data records, of a data structure with regard to the amount and their characteristics.

Ein Zwischendatensatz ist ein Datensatz, der eine Charakteristik aufweist, dessen Betrag zwischen dem Betrag der Charakteristik eines Ausgangstrainingsdatensatz und eines Zieldatensatz ist. Umfasst der Ausgangstrainingsdatensatz Tageslichtbilder und der Zieldatensatz Nachtbilder, kann ein Zwischendatensatz Dämmerungsbilder enthalten. Die Charakteristik ist in diesem Beispiel die Helligkeit oder Lichtintensität.An intermediate data set is a data set that has a characteristic, the amount of which is between the amount of the characteristic of a starting training data set and a target data set. If the initial training data set comprises daylight images and the target data set night images, an intermediate data set can contain twilight images. The characteristic in this example is the brightness or light intensity.

Eine Bilddatei ist eine Datei, in der ein digitales Bild gespeichert wird. Der Inhalt der Datei wurde entweder digital errechnet oder durch Analog-Digital-Wandlung digitalisiert und kann daher vom menschlichen Betrachter unmittelbar weder als Bild erkannt noch als Text gelesen werden. Zur Visualisierung wird ein Gerät benötigt, das den Inhalt wieder in analoge Daten zurückwandelt. Man unterscheidet zwischen einer Rastergrafik, die aus Bildpunkten (Pixeln) zusammengesetzt ist, und einer Vektorgrafik, die mit grafischen Primitiven beschrieben wird.An image file is a file that stores a digital image. The content of the file was either calculated digitally or digitized by analog-digital conversion and can therefore neither be recognized as an image nor read as text by the human viewer. A device that converts the content back into analog data is required for visualization. A distinction is made between raster graphics, which are composed of picture elements (pixels), and vector graphics, which are described with graphic primitives.

Intensitätswerte können zu beliebigen gemessenen Zahlenwerten angegeben werden. Grauwerte sind auch Intensitätswerte. Helligkeitswerte sind z.B. Lichtstärkewerte und geben den auf den Raumwinkel bezogenen Lichtstrom an.Intensity values can be specified for any number of measured values. Gray values are also intensity values. Brightness values are e.g. luminous intensity values and indicate the luminous flux related to the solid angle.

Computerprogrammprodukte umfassen in der Regel eine Folge von Befehlen, durch die die Hardware bei geladenem Programm veranlasst wird, ein bestimmtes Verfahren durchzuführen, das zu einem bestimmten Ergebnis führt.Computer program products generally comprise a sequence of instructions which, when the program is loaded, cause the hardware to carry out a specific method that leads to a specific result.

Die Erfindung sowie weitere Ausführungsformen davon werden im Folgenden anhand einer zeitveränderlichen Charakteristik beschrieben. Es versteht sich, dass die Erfindung auch auf Charakteristika, die nicht von der Zeit, sondern von einem anderen Parameter abhängig sind bzw. sich in Abhängigkeit dessen ändern, anwendbar ist.The invention and further embodiments thereof are described below on the basis of a time-varying characteristic. It goes without saying that the invention can also be applied to characteristics that are not dependent on time, but on another parameter or change as a function thereof.

Die Erfindung geht davon aus, dass sich auszuwertende Eingangsdaten für ein künstliches neuronales Netzwerk kontinuierlich ändern. Häufig sind auszuwertende Eingangsdaten auf eine Umgebung eines Menschen, eines Gegenstands oder eines Geräts bezogen. Dementsprechend ist die vorliegende Erfindung, beispielsweise für sich kontinuierlich ändernde Umgebungen bzw. Umgebungsdaten anwendbar.The invention is based on the assumption that input data to be evaluated for an artificial neural network change continuously. Input data to be evaluated are often related to the environment of a person, an object or a device. Accordingly, the present invention can be used, for example, for continuously changing surroundings or environmental data.

Ein Beispiel für ein sich kontinuierlich änderndes Umgebungsmerkmal ist die Helligkeit. Die Helligkeit nimmt von der Morgendämmerung bis zum Mittag kontinuierlich zu, bis diese mit der Abenddämmerung und dem Sonnenuntergang kontinuierlich abnimmt.An example of a continuously changing environmental feature is brightness. The brightness increases continuously from dawn to noon, until it continuously decreases with dusk and dusk.

Ein weiteres Beispiel für sich kontinuierlich ändernde Eingangsdaten für ein künstliches neuronales Netzwerk sind Dialekte bzw. gesprochene Mundarten, die von einer Spracherkennungssoftware zu analysieren sind, da sich Trainingsdaten mit verschiedenen gesprochenen Dialekten in eine bestimmte Reihenfolge bringen lassen, sodass sich zu analysierende Sprachaufnahmen von einem Trainingsdatensatz zu einem nächsten Trainingsdatensatz kontinuierlich ändern. Beispielsweise ist es denkbar, dass ein Ausgangstrainingsdatensatz zum Trainieren eines künstlichen neuronalen Netzwerks in Hochdeutsch gesprochen ist und ein Zieldatensatz in tirolerischer Mundart gesprochen ist. Es ist denkbar einen oder mehrere Zwischendatensätze, die einen schrittweise Übergang vom Hochdeutschen ins Tirolerische darstellen, bereitzustellen.Another example of continuously changing input data for an artificial neural network are dialects or spoken dialects, which have to be analyzed by speech recognition software, since training data with different spoken dialects can be put into a certain order so that the voice recordings to be analyzed can be analyzed from a training data set to continuously change to a next training data set. For example, it is conceivable that an initial training data set for training an artificial neural network is spoken in High German and a target data set is spoken in Tyrolean dialect. It is conceivable to provide one or more intermediate data records that represent a step-by-step transition from High German to Tyrolean.

An dem Aspekt des kontinuierlichen Übergangs zwischen Trainingsdaten setzt die Erfindung an. Grundlegende Idee der Erfindung ist es, ein künstliches neuronales Netzwerk, welches auf einen Ausgangstrainingsdatensatz trainiert ist, sowie den Ausgangstrainingsdatensatz bereitzustellen. Auf die vorstehenden Beispiele bezogen kann der Ausgangstrainingsdatensatz beispielsweise als Bilddatensatz mit Tageslichtaufnahmen oder als Audiodatensatz mit Sprachaufnahmen in hochdeutscher Sprache ausgebildet sein.The invention is based on the aspect of the continuous transition between training data. The basic idea of the invention is to provide an artificial neural network which is trained on an initial training data set, as well as the initial training data set. In relation to the above examples, the initial training data set can be, for example, as Image data set with daylight recordings or as an audio data record with voice recordings in High German.

Die Erfindung geht davon aus, dass das künstliche neuronale Netzwerk auf den Ausgangstrainingsdatensatz ausreichend trainiert ist, sodass dieses zu entsprechenden Eingangsdaten geeignete Ausgangsdaten ermittelt.The invention is based on the assumption that the artificial neural network is sufficiently trained on the output training data set so that it determines output data suitable for corresponding input data.

Ziel der Erfindung ist es, das künstliche neuronale Netzwerk, welches auf den Ausgangstrainingsdatensatz trainiert ist, auf einen Zieldatensatz zu trainieren, wobei der Zieldatensatz des Ausgangstrainingsdatensatzes hinsichtlich einer Charakteristik beabstandet ist. Dementsprechend unterscheidet sich der Ausgangstrainingsdatensatz von dem Zieldatensatz zumindest hinsichtlich einer Charakteristik.The aim of the invention is to train the artificial neural network, which is trained on the initial training data set, on a target data set, the target data set of the initial training data set being spaced apart with regard to a characteristic. Accordingly, the initial training data set differs from the target data set, at least with regard to one characteristic.

Die Erfindung sieht vor, dass der Ausgangstrainingsdatensatz mit Informationen versehen ist, d. h., dass der Ausgangstrainingsdatensatz gelabelt ist. Handelt es sich bei dem Ausgangstrainingsdatensatz beispielsweise um Bilddaten einer Fahrzeugumgebung, bedeutet dies, dass Umgebungsmerkmale in den Bilddaten, wie beispielsweise eine Straße, ein Kraftfahrzeug, ein Fahrradfahrer, eine Fahrbahnmarkierung, eine Leitplanke und dergleichen in den Bilddaten vermerkt sind. Das künstliche neuronale Netzwerk ist aufgrund dieser Kennzeichnung auf vielfältige Situationen, die sich aus etwaigen Merkmalen ergeben können, trainiert. Das Versehen eines Trainingsdatensatzes mit Informationen (Labeln) ist in der Regel aufwendig.The invention provides that the initial training data set is provided with information, i. That is, that the initial training data set is labeled. If the initial training data set is, for example, image data of a vehicle environment, this means that environmental features in the image data, such as a road, a motor vehicle, a cyclist, a lane marking, a crash barrier and the like, are noted in the image data. Because of this identification, the artificial neural network is trained for a wide range of situations that may result from possible features. Providing a training data set with information (labels) is usually time-consuming.

Die Erfindung ermöglicht es, auf einen geringeren Detailgrad an Informationen in dem Zieldatensatz und/oder Zwischendatensatz zurückzugreifen. Die Erfindung ermöglicht es sogar, einen Zieldatensatz und/oder Zwischendatensatz überhaupt nicht mit Informationen zu versehen, wenn der Abstand zwischen dem Ausgangstrainingsdatensatz und dem benachbarten Datensatz, also dem Zieldatensatz oder einem Zwischendatensatz, klein genug ist.The invention makes it possible to use a lower level of detail of information in the target data record and / or intermediate data record. The invention even makes it possible not to provide a target data record and / or intermediate data record with information at all if the distance between the initial training data record and the neighboring data record, that is to say the target data record or an intermediate data record, is small enough.

Um das künstliche neuronale Netzwerk, welches bereits auf den Zieldatensatz trainiert ist, weiter zu trainieren, genügt es also, das neuronale Netzwerk auf nicht gelabelte Eingangsdaten des Zieldatensatzes zu trainieren. Somit lässt sich das Training eines künstlichen neuronalen Netzwerks vereinfachen.In order to further train the artificial neural network which has already been trained on the target data set, it is sufficient to train the neural network on unlabeled input data of the target data set. The training of an artificial neural network can thus be simplified.

Vorteilhafte Ausgestaltungen und Weiterbildungen ergeben sich aus den weiteren Unteransprüchen sowie aus der Beschreibung unter Bezugnahme auf die Figuren der Zeichnung.Advantageous refinements and developments result from the further subclaims and from the description with reference to the figures of the drawing.

Dabei ist es auch zweckmäßig, wenn hinsichtlich der Charakteristik ein Abstandsmaß existiert, welches einen Abstand zwischen dem Ausgangstrainingsdatensatz und dem Zieldatensatz definiert. Ein besonders anschauliches Abstandsmaß ist beispielsweise der Abstand zwischen Daten des MNIST-Trainingsdatensatzes als Ausgangstrainingsdatensatz und Daten des MNIST-Trainingsdatensatzes, welche um 180° gedreht sind, als Zieldatensatz. In diesem Fall beträgt der Abstand zwischen dem Ausgangstrainingsdatensatz und dem Zieldatensatz 180°. Es versteht sich jedoch, dass auch Abstandsmaße zwischen einem Ausgangstrainingsdatensatz und einem Zieldatensatz denkbar sind, die weniger anschaulich sind. Beispielsweise lässt sich auch ein Abstandsmaß konstruieren, welches den Abstand zwischen zwei Sprachaufnahmen angibt.It is also expedient here if, with regard to the characteristic, there is a distance measure which defines a distance between the initial training data record and the target data record. A particularly clear distance measure is, for example, the distance between data of the MNIST training data set as the initial training data set and data of the MNIST training data set, which are rotated by 180 °, as the target data set. In this case, the distance between the initial training data set and the target data set is 180 °. It goes without saying, however, that distance measures between an initial training data set and a target data set are also conceivable that are less clear. For example, a distance measure can also be constructed which indicates the distance between two voice recordings.

Die MNIST-Datenbank (Modified National Institute of Standards and Technology) ist eine große Datenbank mit Datensätzen handgeschriebener Ziffern, die üblicherweise zum Trainieren verschiedener Bildverarbeitungssysteme verwendet wird. Ein Beispiel aus der MNIST-Datenbank ist in 1 zu sehen.The MNIST (Modified National Institute of Standards and Technology) database is a large database of records of handwritten digits that is commonly used to train various vision systems. An example from the MNIST database is in 1 to see.

Es versteht sich, dass es im Lichte der Erfindung auch möglich ist, ein Abstandsmaß zu definieren, welches lediglich eine Vergleichsrelation größer bzw. kleiner zwischen Trainingsdatensätzen definiert. Beispielsweise ist es denkbar, ein künstliches neuronales Netzwerk für ein Fahrerassistenzsystem mit fahrzeugumgebungsbezogenen Bilddaten aus dem Jahr 2010 zu trainieren. Es ist davon auszugehen, dass zehn Jahre später, also im Jahr 2020, sich Fahrzeugmodelle derartig geändert haben, dass ein spezifisches Training auf neue Fahrzeugmodelle erforderlich sein kann. In diesem Fall ist es nicht zwingend erforderlich, den Abstand zwischen den Datensätzen aus dem Jahr 2010 und 2020 zu beziffern. Es ist jedoch möglich, festzustellen, dass ein weiterer möglicher Zwischendatensatz aus dem Jahr 2015 einen geringeren Abstand zu dem Zieldatensatz als der Ausgangstrainingsdatensatz aus dem Jahr 2010 aufweist.It goes without saying that in the light of the invention it is also possible to define a distance measure which only defines a comparison relation larger or smaller between training data sets. For example, it is conceivable to train an artificial neural network for a driver assistance system with image data relating to the vehicle environment from 2010. It can be assumed that ten years later, i.e. in 2020, vehicle models will have changed in such a way that specific training on new vehicle models may be necessary. In this case, it is not absolutely necessary to quantify the distance between the data sets from 2010 and 2020. However, it is possible to determine that a further possible intermediate data set from 2015 has a smaller gap to the target data set than the initial training data set from 2010.

Folglich ist es auch denkbar, ein Abstandsmaß oder eine Abstandsrelation für zeitveränderliche Trainingsdatensätze anhand des Erfassungszeitpunkts zu definieren.Consequently, it is also conceivable to define a distance measure or a distance relation for time-variable training data sets on the basis of the acquisition time.

Gemäß einer bevorzugten Weiterbildung der Erfindung wird wenigstens ein Zwischendatensatz generiert oder bereitgestellt, welcher hinsichtlich der Charakteristik zwischen dem Ausgangstrainingsdatensatz und dem Zieldatensatz angeordnet ist und das künstliche neuronale Netzwerk mittels des Zwischentrainingsdatensatzes trainiert wird.According to a preferred development of the invention, at least one intermediate data set is generated or provided which, with regard to the characteristics, is arranged between the initial training data set and the target data set and the artificial neural network is trained by means of the intermediate training data set.

Auf das obige Beispiel bezogen kann der Zwischendatensatz beispielsweise als Trainingsdatensatz mit fahrzeugumgebungsbezogenen Bilddaten aus dem Jahr 2015 ausgebildet sein, wenn der Ausgangstrainingsdatensatz fahrzeugumgebungsbezogene Bilddaten aus dem Jahr 2010 und der Zieldatensatz fahrzeugumgebungsbezogene Bilddaten aus dem Jahr 2020 aufweist. In vorstehendem Beispiel bilden die Eigenschaften von Fahrzeugmodellen die Charakteristik aus.In relation to the above example, the intermediate data record can be used, for example, as a training data record with image data relating to the vehicle environment from the year 2015 if the initial training data record has vehicle-environment-related image data from 2010 and the target data record has vehicle-environment-related image data from 2020. In the above example, the properties of vehicle models form the characteristic.

Auf das MNIST-Beispiel bezogen kann auch vorgesehen sein, dass die Schrittweite zwischen dem Ausgangstrainingsdatensatz und dem nächsten Zwischendatensatz bzw. zwischen zwei benachbarten Zwischendatensätzen bzw. zwischen einem Zwischendatensatz und dem Zieldatensatz 1° beträgt. Ist der Zieldatensatz gegenüber dem Ausgangstrainingsdatensatz um 180° gedreht, sind bei einer Schrittweite von 1° 179 Zwischendatensätze erforderlich.With reference to the MNIST example, it can also be provided that the step size between the initial training data set and the next intermediate data set or between two adjacent intermediate data sets or between an intermediate data set and the target data set is 1 °. If the target data set is rotated by 180 ° compared to the initial training data set, 179 intermediate data sets are required with a step size of 1 °.

Dementsprechend kann also vorgesehen sein, dass hinsichtlich der Charakteristik eine Schrittweite, die den Abstand bzw. eine Abstandsrelation zwischen dem Ausgangstrainingsdatensatz und einem ersten Zwischendatensatz, einem ersten Zwischendatensatz und einem zweiten Zwischendatensatz und/oder einem n-ten Zwischendatensatz und dem Zieldatensatz, wobei n eine positive ganze Zahl ist, vorgibt, ermittelt wird und das künstliche neuronale Netzwerk mittels der Zwischendatensätze trainiert wird.Accordingly, it can be provided that, with regard to the characteristic, a step size, which is the distance or a distance relation between the initial training data set and a first intermediate data set, a first intermediate data set and a second intermediate data set and / or an n-th intermediate data set and the target data set, where n is a is a positive integer, specifies, is determined and the artificial neural network is trained by means of the intermediate data sets.

Dementsprechend kann vorgesehen sein, dass das künstliche neuronale Netzwerk schrittweise mittels Zwischendatensätzen trainiert wird, bis sich die Zwischendatensätze dem Zieldatensatz ausreichend angenähert haben.Accordingly, it can be provided that the artificial neural network is trained step-by-step using intermediate data records until the intermediate data records have sufficiently approximated the target data record.

Es versteht sich, dass dabei auch vorgesehen sein kann, dass eine geeignete Schrittweite, beispielsweise mittels eines Algorithmus, ermittelt wird.It goes without saying that it can also be provided that a suitable step size is determined, for example by means of an algorithm.

Dabei kann ferner vorgesehen sein, dass das künstliche neuronale Netzwerk, beginnend mit dem Zwischendatensatz, der hinsichtlich der Charakteristik den geringsten Abstand zu dem Ausgangstrainingsdatensatz aufweist, und im Folgenden jeweils mit dem nächst benachbarten Zwischendatensatz bzw. dem Zieldatensatz trainiert wird.It can also be provided that the artificial neural network is trained, starting with the intermediate data set, which has the smallest distance to the initial training data set in terms of characteristics, and is then trained with the next adjacent intermediate data set or the target data set.

Am Beispiel des MNIST-Datensatz bedeutet dies anschaulich erläutert, dass das künstliche neuronale Netzwerk zunächst mit einem ersten Zwischendatensatz, der beispielsweise gegenüber dem Ausgangstrainingsdatensatz um 1° rotiert ist, trainiert wird. Als nächstes wird das künstliche neuronale Netzwerk mit 178 weiteren Zwischendatensätzen, die jeweils um ein weiteres Grad rotiert sind, trainiert bis das künstliche neuronale Netzwerk mit einem Zwischendatensatz trainiert ist, der gegenüber dem Ausgangstrainingsdatensatz um 179° rotiert ist, trainiert wurde. Als letztes Training des künstlichen neuronalen Netzwerks erfolgt das Training mittels des Zieldatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 180° rotiert ist.Using the example of the MNIST data set, this means, clearly explained, that the artificial neural network is initially trained with a first intermediate data set, which is rotated by 1 °, for example, with respect to the initial training data set. Next, the artificial neural network is trained with 178 further intermediate data sets, each of which is rotated by a further degree, until the artificial neural network has been trained with an intermediate data set that has been rotated by 179 ° compared to the initial training data set. As the last training of the artificial neural network, the training takes place by means of the target data set, which is rotated by 180 ° with respect to the initial training data set.

Dabei kann auch vorgesehen sein, dass das künstliche neuronale Netzwerk zwischen dieser Abfolge mittels des Ausgangstrainingsdatensatz und/oder mittels bereits trainierten Zwischendatensätzen nachtrainiert wird. Somit ist gewährleistet, dass das künstliche neuronale Netzwerk die Fähigkeiten hinsichtlich des Ausgangstrainingsdatensatz bzw. hinsichtlich bereits trainierten Trainingsdatensätzen beibehält. Vergisst das künstliche neuronale Netzwerk Fähigkeiten, wird dieses im Fachjargon auch als „catastrophic forgetting“ bezeichnet. Dieser Effekt wird durch das Nachtrainieren mit Datensätzen, die bereits trainiert wurden, reduziert.It can also be provided that the artificial neural network is retrained between this sequence using the initial training data set and / or using intermediate data sets that have already been trained. This ensures that the artificial neural network retains the capabilities with regard to the initial training data set or with regard to training data sets that have already been trained. If the artificial neural network forgets capabilities, this is also referred to in technical jargon as "catastrophic forgetting". This effect is reduced by retraining with data sets that have already been trained.

Gemäß einer bevorzugten Weiterbildung der Erfindung wird der Zieldatensatz und/oder der Zwischendatensatz in einem geringeren Detailgrad mit Informationen versehen als der Ausgangstrainingsdatensatz. Insbesondere kann vorgesehen sein, dass der Zieldatensatz und/oder der wenigstens eine Zwischendatensatz nicht mit Informationen versehen sind. Datensätze, die mit Informationen versehen sind, werden im Fachjargon auch als gelabelte Datensätze bezeichnet. Das Training eines künstlichen neuronalen Netzwerks mit gelabelten Datensätzen wird im Fachjargon auch als überwachtes maschinelles Lernen (supervised machine learning) bezeichnet. Das Training eines künstlichen neuronalen Netzwerks mittels nicht gelabelten Datensätzen wird im Fachjargon auch als unüberwachtes maschinelles Lernen (unsupervised machine learning) bezeichnet.According to a preferred development of the invention, the target data record and / or the intermediate data record is provided with information in a lower degree of detail than the initial training data record. In particular, it can be provided that the target data record and / or the at least one intermediate data record are not provided with information. Data records that are provided with information are also referred to in technical jargon as labeled data records. The training of an artificial neural network with labeled data sets is also referred to in technical jargon as supervised machine learning. The training of an artificial neural network using unlabeled data sets is also known in technical jargon as unsupervised machine learning.

Typischerweise ist das Labeln von Trainingsdatensätzen mit einem großen Aufwand verbunden, sodass das überwachte maschinelle Lernen gegenüber dem unüberwachten maschinellen Lernen deutlich aufwendiger und auch kostenintensiver ist.The labeling of training data sets is typically associated with a great deal of effort, so that monitored machine learning is significantly more complex and cost-intensive compared to unsupervised machine learning.

Aufgrund des schrittweisen Trainings von einem gelabelten Ausgangstrainingsdatensatz hin zu einem nicht oder geringer gelabelten Zieldatensatz lassen sich die positiven Effekte durch das überwachte Training des Ausgangstrainingsdatensatz auf die folgenden nicht überwachten Trainings überführen. Somit lässt sich das Training des Ziel- bzw. Zwischendatensatzes deutlich verbessern, wobei der Aufwand hinsichtlich des Labelns geringgehalten wird.Due to the step-by-step training from a labeled initial training data set to a non-labeled or less labeled target data set, the positive effects of the monitored training of the initial training data set can be transferred to the subsequent, non-monitored training sessions. The training of the target or intermediate data record can thus be significantly improved, with the effort in terms of labeling being kept low.

Wie vorstehend bereits anhand von Beispielen beschrieben wurde, kann der Ausgangstrainingsdatensatz, der Zieldatensatz und der Zwischendatensatz Bilddaten umfassen.As already described above on the basis of examples, the initial training data set, the target data set and the intermediate data set can comprise image data.

Gemäß einer bevorzugten Weiterbildung der Erfindung ist die Charakteristik ein zeitveränderlicher Parameter. Dabei ist vorgesehen, dass sich die Charakteristik von dem Ausgangstrainingsdatensatz während einer Zeitspanne zu der Charakteristik des Zwischendatensatz bzw. des Zieldatensatz verändert.According to a preferred development of the invention, the characteristic is a time-variable parameter. It is provided that the characteristic of the initial training data set changes during a period of time to the characteristic of the intermediate data set or the target data set.

Diesbezüglich kann beispielsweise vorgesehen sein, dass die Charakteristik ein Helligkeitswert von Bilddaten ist.In this regard, it can be provided, for example, that the characteristic is a brightness value of image data.

Dementsprechend kann beispielsweise vorgesehen sein, dass ein künstliches neuronales Netzwerk mittels eines Ausgangstrainingsdatensatz, der Bilddaten, die tagsüber aufgenommen wurden, umfasst, trainiert ist. Im Folgenden kann der Zieldatensatz beispielsweise Bilddaten, die in der Nacht aufgenommen wurden, umfassen. Dementsprechend würden sich Zwischendatensätze schrittweise vom Tageslicht an das Nachtlicht annähern. Dementsprechend kann beispielsweise vorgesehen sein, dass ein möglicher Zwischendatensatz Bilddaten, die während einer Dämmerung aufgenommen wurden, umfasst.Accordingly, it can be provided, for example, that an artificial neural network is trained by means of an initial training data record that includes image data that were recorded during the day. In the following, the target data record can for example include image data that were recorded during the night. Accordingly, intermediate data sets would gradually approach from daylight to nightlight. Accordingly, it can be provided, for example, that a possible intermediate data record includes image data that were recorded during twilight.

Gemäß einer bevorzugten Weiterbildung der Erfindung ist das künstliche neuronale Netzwerk, welches mittels des Ausgangstrainingsdatensatz trainiert ist, als erstes künstliches neuronales Netzwerk gespeichert und es wird eine Kopie des ersten künstlichen neuronalen Netzwerks mittels des Verfahrens wie es vorstehend beschrieben wurde trainiert und als zweites künstliches neuronales Netzwerk gespeichert. Um zu entscheiden, ob das erste oder das zweite künstliche neuronale Netzwerk geeignet ist, Ausgangsdaten zu bestimmten Eingangsdaten zu ermitteln, wird ein Klassifikator eingesetzt, der trainiert wird, das geeignete künstliche neuronale Netzwerk zu ermitteln.According to a preferred development of the invention, the artificial neural network that is trained using the initial training data set is stored as the first artificial neural network and a copy of the first artificial neural network is trained using the method as described above and as the second artificial neural network saved. In order to decide whether the first or the second artificial neural network is suitable for determining output data for specific input data, a classifier is used which is trained to determine the suitable artificial neural network.

Alternativ ist es auch möglich, ein künstliches neuronales Netzwerk derart zu trainieren, dass dieses geeignete Ausgangsdaten zu Eingangsdaten entsprechend des Ausgangstrainingsdatensatz, des Zieldatensatz und optional des Zwischendatensatz ermittelt.Alternatively, it is also possible to train an artificial neural network in such a way that it determines suitable output data for input data in accordance with the output training data set, the target data set and optionally the intermediate data set.

Gemäß einer bevorzugten Weiterbildung der Erfindung wird der wenigstens eine Zwischendatensatz und/oder der Zieldatensatz mittels eines GAN generiert. Somit lassen sich authentische Trainingsdaten von einem Algorithmus generieren. Dies ist einfacher als reale Trainingsdaten zu sammeln.According to a preferred development of the invention, the at least one intermediate data record and / or the target data record is generated by means of a GAN. Authentic training data can thus be generated by an algorithm. This is easier than collecting real training data.

Das Computerprogrammprodukt gemäß einer Ausführungsform der Erfindung führt die Schritte eines Verfahrens gemäß der vorangehenden Beschreibung aus, wenn das Computerprogrammprodukt auf einem Computer, insbesondere einem fahrzeuginternen Computer, läuft. Wenn das betreffende Programm auf einem Computer zum Einsatz kommt, ruft das Computerprogrammprodukt einen Effekt hervor, nämlich das Vereinfachen eines Trainings eins künstlichen neuronalen Netzwerks.The computer program product according to an embodiment of the invention carries out the steps of a method according to the preceding description when the computer program product runs on a computer, in particular a computer internal to the vehicle. When the program in question is used on a computer, the computer program product brings about an effect, namely the simplification of training an artificial neural network.

FigurenlisteFigure list

Die vorliegende Erfindung wird nachfolgend anhand der in den schematischen Figuren der Zeichnungen angegebenen Ausführungsbeispiele näher erläutert. Es zeigen dabei:

  • 1 mehrere Trainingsdatensätze zum Trainieren eines künstlichen neuronalen Netzwerks mittels einer Ausführungsform der Erfindung;
  • 2 mehrere Performanzdiagramme zu verschiedenen Ausführungsformen der Erfindung;
  • 3 ein schematisches Blockdiagramm gemäß einer Ausführungsform der Erfindung.
The present invention is explained in more detail below with reference to the exemplary embodiments specified in the schematic figures of the drawings. It shows:
  • 1 several training data sets for training an artificial neural network by means of an embodiment of the invention;
  • 2 several performance diagrams for various embodiments of the invention;
  • 3 a schematic block diagram according to an embodiment of the invention.

Die beiliegenden Zeichnungen sollen ein weiteres Verständnis der Ausführungsformen der Erfindung vermitteln. Sie veranschaulichen Ausführungsformen und dienen im Zusammenhang mit der Beschreibung der Erklärung von Prinzipien und Konzepten der Erfindung. Andere Ausführungsformen und viele der genannten Vorteile ergeben sich im Hinblick auf die Zeichnungen. Die Elemente der Zeichnungen sind nicht notwendigerweise maßstabsgetreu zueinander gezeigt.The accompanying drawings are intended to provide a further understanding of the embodiments of the invention. They illustrate embodiments and, in conjunction with the description, serve to explain principles and concepts of the invention. Other embodiments and many of the advantages mentioned emerge with a view to the drawings. The elements of the drawings are not necessarily shown to scale with one another.

In den Figuren der Zeichnungen sind gleiche, funktionsgleiche und gleichwirkende Elemente, Merkmale und Komponenten - sofern nicht anders ausgeführt ist - jeweils mit denselben Bezugszeichen versehen.In the figures of the drawings, elements, features and components that are identical, functionally identical and have the same effect - unless otherwise stated - are each provided with the same reference symbols.

BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELENDESCRIPTION OF EXEMPLARY EMBODIMENTS

1 zeigt Trainingsdatensätze 101, 103, 105 und 107 zum Trainieren eines künstlichen neuronalen Netzwerks gemäß einer Ausführungsform der Erfindung. Der Trainingsdatensatz 101 bildet einen gelabelten Ausgangstrainingsdatensatz, der handgeschriebene Zahlen des MNIST-Datensatz enthält. Der Datensatz 107 bildet einen Zieldatensatz und enthält Zahlen des MNIST-Datensatz, die gegenüber dem Ausgangstrainingsdatensatz 101 um 90° gedreht sind. Die Datensätze 103 und 105 bilden Zwischendatensätze, wobei der Datensatz 103 gegenüber dem Ausgangstrainingsdatensatz um 30° gedreht ist und der Trainingsdatensatz 105 gegenüber dem Ausgangstrainingsdatensatz um 60° gedreht ist. 1 shows training records 101 , 103 , 105 and 107 for training an artificial neural network according to an embodiment of the invention. The training data set 101 forms a labeled output training record containing handwritten numbers from the MNIST record. The record 107 forms a target data set and contains numbers of the MNIST data set which are opposite to the initial training data set 101 rotated by 90 °. The records 103 and 105 form intermediate data records, with the data record 103 is rotated by 30 ° with respect to the initial training data set and the training data set 105 is rotated by 60 ° compared to the initial training data set.

Ziel des Verfahrens ist es, ein künstliches neuronales Netzwerk, welches auf die Erkennung der Zahlen des Ausgangstrainingsdatensatz 101 trainiert ist, hinsichtlich der Erkennung von rotierten Zahlen aus dem Zieldatensatz und aus den Zwischendatensätzen anzulernen. Hierfür wird das künstliche neuronale Netzwerk schrittweise, ausgehend von den Zwischendatensätzen, trainiert, bis die Drehung des Zieldatensatzes erreicht wurde.The aim of the procedure is to create an artificial neural network which is based on the recognition of the numbers of the initial training data set 101 is trained to recognize rotated numbers learn from the target data set and from the intermediate data sets. For this purpose, the artificial neural network is trained step by step, starting from the intermediate data records, until the rotation of the target data record has been reached.

Für das Training lassen sich mehrere Koeffizienten festlegen, die sich auf die Performanz des Verfahrens auswirken. Der Einfluss der verschiedenen Koeffizienten ist in 2 erläutert.Several coefficients can be set for training, which affect the performance of the method. The influence of the various coefficients is in 2 explained.

2 zeigt drei Diagramme 201, 203, 205 zur Performanz jeweils eines Verfahrens, welches auf die Erkennung von Zahlen aus dem MNIST-Datensatz trainiert ist. Die Zahlen aus dem MNIST-Datensatz werden von einem trainierten künstlichen neuronalen Netzwerk erkannt. 2 shows three diagrams 201 , 203 , 205 for the performance of a method which is trained to recognize numbers from the MNIST data set. The numbers from the MNIST data set are recognized by a trained artificial neural network.

Das künstliche neuronale Netzwerk, dessen Performanz in dem Diagramm 201 gezeigt ist, wurde 50-mal auf den MNIST-Ausgangstrainingsdatensatz trainiert. Zudem wurde das künstliche neuronale Netzwerk, dessen Performanz in dem Diagramm 201 gezeigt ist, zweimal auf jeden Zwischendatensatz trainiert. Ferner wurde das künstliche neuronale Netzwerk in jedem Zwischenschritt einmal auf den Ausgangstrainingsdatensatz 101 nachtrainiert. In dem Diagramm 201 beträgt die Schrittweite zwischen Trainingsdatensätzen 1°.The artificial neural network, its performance in the diagram 201 shown was trained 50 times on the MNIST output training dataset. In addition, the artificial neural network, its performance in the diagram 201 is shown trained twice on each intermediate record. In addition, the artificial neural network was applied once to the initial training data set in each intermediate step 101 retrained. In the diagram 201 the step size between training data sets is 1 °.

Die Kurven 21 der Diagramme 201, 203, 205 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks in dem Ausgangstrainingsdatensatz, der nicht rotiert ist. Auf der X-Achse ist die Drehung in Grad angetragen, auf die das KNN trainiert wurde. Die Kurven 22 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 10° gedreht ist. Die Kurven 23 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 20° gedreht ist. Die Kurven 24 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 30° gedreht ist. Die Kurven 25 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 40° gedreht ist. Die Kurven 26 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 50° gedreht ist. Die Kurven 27 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 60° gedreht ist. Die Kurven 28 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 70° gedreht ist. Die Kurven 29 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 80° gedreht ist. Die Kurven 30 zeigen jeweils die Performanz des künstlichen neuronalen Netzwerks für den Zwischendatensatz, der gegenüber dem Ausgangstrainingsdatensatz um 90° gedreht ist.The curves 21st of the diagrams 201 , 203 , 205 each show the performance of the artificial neural network in the output training data set that is not rotated. The rotation to which the ANN was trained is plotted on the X-axis. The curves 22nd each show the performance of the artificial neural network for the intermediate data set, which is rotated by 10 ° with respect to the initial training data set. The curves 23 each show the performance of the artificial neural network for the intermediate data set, which is rotated by 20 ° with respect to the initial training data set. The curves 24 each show the performance of the artificial neural network for the intermediate data set, which is rotated by 30 ° with respect to the initial training data set. The curves 25th each show the performance of the artificial neural network for the intermediate data set, which is rotated by 40 ° with respect to the initial training data set. The curves 26th each show the performance of the artificial neural network for the intermediate data set, which is rotated by 50 ° with respect to the initial training data set. The curves 27 each show the performance of the artificial neural network for the intermediate data set, which is rotated by 60 ° with respect to the initial training data set. The curves 28 each show the performance of the artificial neural network for the intermediate data set, which is rotated by 70 ° with respect to the initial training data set. The curves 29 each show the performance of the artificial neural network for the intermediate data set, which is rotated by 80 ° with respect to the initial training data set. The curves 30th each show the performance of the artificial neural network for the intermediate data set, which is rotated by 90 ° with respect to the initial training data set.

Alle Diagramme 201, 203 und 205 zeigen, dass sich die Performanz eines künstlichen neuronalen Netzwerks so lange verbessert, bis das Netzwerk auf die Drehung des Datensatzes, auf welchem die Performanz geplottet ist, trainiert wurde. Danach verschlechtert sich die Performanz wieder. Beispielsweise steigt die Performanz der Kurven 25 in jeder Konfiguration so lange an bis das künstliche neuronale Netzwerk auf 40° trainiert wurde. Danach nimmt die Performanz in allen Konfigurationen wieder ab.All diagrams 201 , 203 and 205 show that the performance of an artificial neural network improves until the network has been trained to rotate the data set on which the performance is plotted. After that, the performance deteriorates again. For example, the performance of the curves increases 25th in each configuration until the artificial neural network has been trained to 40 °. After that, the performance decreases again in all configurations.

Folglich geht aus dem Diagramm 201 hervor, dass sich die Performanz auf dem Ausgangstrainingsdatensatz durch das Trainieren weiterer Zwischendatensätze etwas verschlechtert. Im Gegenzug wird für alle Zwischendatensätze und auch für den Zieldatensatz eine signifikante Verbesserung erreicht, jedoch ist auch ersichtlich, dass die Performanz auf den stärker gedrehten Zwischendatensätzen bzw. auf den Zieldatensatz nicht annähernd die gleiche Güte wie jene des Ausgangstrainingsdatensatz erreicht. Dieser Effekt kann in dem Diagramm 201 durch das Training allenfalls abgemildert werden.Hence goes from the diagram 201 shows that the performance on the initial training data set deteriorates somewhat as a result of the training of further intermediate data sets. In return, a significant improvement is achieved for all intermediate data sets and also for the target data set, but it can also be seen that the performance on the more strongly rotated intermediate data sets or on the target data set does not achieve approximately the same quality as that of the initial training data set. This effect can be seen in the diagram 201 may be attenuated by the training.

Die künstlichen neuronalen Netzwerke, deren Performanz in dem Diagramm 203 gezeigt ist, wurden 50-mal auf den MNIST-Ausgangstrainingsdatensatz trainiert. Zudem wurden die künstlichen neuronalen Netzwerke, deren Performanz in dem Diagramm 203 gezeigt ist, sechsmal auf jeden Zwischendatensatz trainiert. Ferner wurden die künstlichen neuronalen Netzwerke in jedem Zwischenschritt dreimal auf den Ausgangstrainingsdatensatz 101 nachtrainiert. In dem Diagramm 203 beträgt die Schrittweite zwischen Trainingsdatensätzen 1°.The artificial neural networks, their performance in the diagram 203 shown were trained 50 times on the initial MNIST training data set. In addition, the artificial neural networks, their performance in the diagram 203 is shown trained six times on each intermediate data set. Furthermore, the artificial neural networks were applied three times to the initial training data set in each intermediate step 101 retrained. In the diagram 203 the step size between training data sets is 1 °.

Im Gegensatz zu dem Diagramm 201 wird in dem Diagramm 203, die Performanz auf dem Ausgangstrainingsdatensatz bzw. auf den frühen Zwischentrainingsdatensätzen mit zunehmender Drehung der Zwischendatensätze, auf die das KNN trainiert wird, deutlich schlechter. Im Gegenzug dazu ist die erreichte Performanz jedoch auf den Zwischendatensätzen bis ca. 70° gegenüber dem Diagramm 201 deutlich verbessert.In contrast to the diagram 201 is in the diagram 203 , the performance on the initial training data set or on the early intermediate training data sets with increasing rotation of the intermediate data sets on which the ANN is trained, significantly worse. In return, however, the performance achieved on the intermediate data records is up to approx. 70 ° compared to the diagram 201 clearly improved.

Die künstlichen neuronalen Netzwerke, deren Performanz in dem Diagramm 205 gezeigt ist, wurden 50-mal auf den MNIST-Ausgangstrainingsdatensatz trainiert. Zudem wurden die künstlichen neuronalen Netzwerke einmal auf jeden Zwischendatensatz trainiert. Während des Trainings auf die Zwischendatensätze wurden die künstlichen neuronalen Netzwerke nicht auf den Ausgangstrainingsdatensatz nachtrainiert. Die Schrittweite beträgt 0,1 °.The artificial neural networks, their performance in the diagram 205 shown were trained 50 times on the initial MNIST training data set. In addition, the artificial neural networks were trained once for each intermediate data set. During the training on the intermediate data sets, the artificial neural networks were not retrained on the initial training data set. The step size is 0.1 °.

Dementsprechend ist die Performanz der künstlichen neuronalen Netzwerke zwischen den einzelnen Trainingsdatensätzen symmetrisch. D. h., das künstliche neuronale Netzwerk, welches auf den Ausgangstrainingsdatensatz trainiert ist, startet mit einer sehr guten Performanz für den Ausgangstrainingsdatensatz bzw. mit einer schlechten Performanz für den Zieldatensatz. Am Ende des Trainings ist die Performanz gespiegelt, d. h. die Performanz auf dem Zieldatensatz ist sehr gut, entsprechend der Performanz auf dem Ausgangstrainingsdatensatz, bevor das künstliche neuronale Netzwerk auf die Zwischendatensätze trainiert wurde. Im Gegenzug ist die Performanz auf dem Ausgangstrainingsdatensatz, nachdem das künstliche neuronale Netzwerk auf die Zwischendatensätze und den Zieldatensatz trainiert wurde entsprechend der Performanz auf dem Zieldatensatz, bevor das künstliche neuronale Netzwerk auf den Zieldatensatz und auf die Zwischendatensätze trainiert wurde.Accordingly, the performance of the artificial neural networks between the individual training data sets is symmetrical. That is to say, the artificial neural network which is trained on the initial training data set starts with a very good performance for the initial training data set or with a poor performance for the target data set. At the end of the training, the performance is mirrored, i. H. the performance on the target data set is very good, corresponding to the performance on the initial training data set before the artificial neural network was trained on the intermediate data sets. In contrast, the performance on the initial training data set after the artificial neural network has been trained on the intermediate data sets and the target data set corresponds to the performance on the target data set before the artificial neural network has been trained on the target data set and the intermediate data sets.

3 zeigt ein Blockdiagramm gemäß einer Ausführungsform eines Verfahrens zum Trainieren eines künstlichen neuronalen Netzwerks gemäß einer Ausführungsform der Erfindung. In dem Schritt S1 wird ein Ausgangstrainingsdatensatz, welcher mit Informationen versehen ist, sowie ein künstliches neuronales Netzwerk, welches mittels des Ausgangstrainingsdatensatz trainiert wurde, bereitgestellt. In dem Schritt S2 wird ein Zieldatensatz, welcher sich hinsichtlich einer Charakteristik von dem Ausgangstrainingsdatensatz unterscheidet, bereitgestellt. In dem Schritt S3 wird das künstliche neuronale Netzwerk mittels des Zieldatensatz trainiert. 3 FIG. 10 shows a block diagram according to an embodiment of a method for training an artificial neural network according to an embodiment of the invention. In the step S1 an initial training data set, which is provided with information, and an artificial neural network, which was trained using the initial training data set, are provided. In the step S2 a target data set, which differs from the initial training data set in terms of a characteristic, is provided. In the step S3 the artificial neural network is trained using the target data set.

BezugszeichenlisteList of reference symbols

2121st
PerformanzkurvePerformance curve
2222nd
PerformanzkurvePerformance curve
2323
PerformanzkurvePerformance curve
2424
PerformanzkurvePerformance curve
2525th
PerformanzkurvePerformance curve
2626th
PerformanzkurvePerformance curve
2727
PerformanzkurvePerformance curve
2828
PerformanzkurvePerformance curve
2929
PerformanzkurvePerformance curve
3030th
Performanzkurve Performance curve
101101
Trainingsdatensatz.Training data set.
103103
Trainingsdatensatz.Training data set.
105105
Trainingsdatensatz.Training data set.
107107
TrainingsdatensatzTraining data set
201201
Diagrammdiagram
203203
Diagrammdiagram
205205
Diagramm diagram
S1-S3S1-S3
VerfahrensschritteProcedural steps

Claims (15)

Trainingsverfahren für ein künstliches neuronales Netzwerk, welches eingerichtet ist, aufgrund von Eingangsdaten Ausgangsdaten zu ermitteln, mit den folgenden Schritten: - Bereitstellen (S1) eines Ausgangstrainingsdatensatzes, welcher mit Informationen versehen ist, sowie eines künstlichen neuronalen Netzwerks, welches mittels des Ausgangstrainingsdatensatzes trainiert wurde; - Bereitstellen (S2) eines Zieldatensatzes, welcher sich hinsichtlich einer Charakteristik von dem Ausgangstrainingsdatensatz unterscheidet; - Trainieren (S3) des künstlichen neuronalen Netzwerks mittels des Zieldatensatzes.Training method for an artificial neural network, which is set up to determine output data based on input data, with the following steps: - providing (S1) an initial training data set which is provided with information, as well as an artificial neural network which was trained using the initial training data set; - Providing (S2) a target data set which differs from the initial training data set in terms of a characteristic; - Training (S3) the artificial neural network by means of the target data set. Trainingsverfahren für ein künstliches neuronales Netzwerk nach Anspruch 1, wobei hinsichtlich der Charakteristik ein Abstandsmaß existiert, welches einen Abstand oder eine Abstandsrelation zwischen dem Ausgangstrainingsdatensatz und dem Zieldatensatz definiert.Training method for an artificial neural network according to Claim 1 , wherein with regard to the characteristic there is a distance measure which defines a distance or a distance relation between the initial training data set and the target data set. Trainingsverfahren für ein künstliches neuronales Netzwerk nach einem der vorstehenden Ansprüche, wobei wenigstens ein Zwischendatensatz generiert oder bereitgestellt wird, welcher hinsichtlich der Charakteristik zwischen dem Ausgangstrainingsdatensatz und dem Zieldatensatz angeordnet ist und das künstliche neuronale Netzwerk mittels des Zwischendatensatz trainiert wird.Training method for an artificial neural network according to one of the preceding claims, wherein at least one intermediate data set is generated or provided, which is arranged in terms of the characteristic between the initial training data set and the target data set and the artificial neural network is trained using the intermediate data set. Trainingsverfahren für ein künstliches neuronales Netzwerk nach Anspruch 3, wobei hinsichtlich der Charakteristik eine Schrittweite, die den Abstand zwischen dem Ausgangstrainingsdatensatz und einem ersten Zwischendatensatz, einem ersten Zwischendatensatz und einem zweiten Zwischendatensatz und/oder einem n-ten-Zwischendatensatz und dem Zieldatensatz, wobei n eine positive ganze Zahl ist, vorgegeben ist und das künstliche neuronale Netzwerk mittels der Zwischendatensätze trainiert wird.Training method for an artificial neural network according to Claim 3 , wherein, with regard to the characteristic, a step size which is the distance between the initial training data record and a first intermediate data record, a first intermediate data record and a second intermediate data record and / or an n-th intermediate data record and the target data record, where n is a positive integer, is predetermined the artificial neural network is trained by means of the intermediate data sets. Trainingsverfahren für ein künstliches neuronales Netzwerk nach Anspruch 4, wobei eine geeignete Schrittweite zwischen verschiedenen Datensätzen ermittelt wird.Training method for an artificial neural network according to Claim 4 , whereby a suitable step size between different data sets is determined. Trainingsverfahren für ein künstliches neuronales Netzwerk nach einem der Ansprüche 4 oder 5, wobei das künstliche neuronale Netzwerk beginnend mit dem Zwischendatensatz, der hinsichtlich der Charakteristik den geringsten Abstand zu dem Ausgangstrainingsdatensatz aufweist, und im Folgenden jeweils mit dem nächst benachbarten Zwischendatensatz bzw. Zieldatensatz trainiert wird.Training method for an artificial neural network according to one of the Claims 4 or 5 , wherein the artificial neural network is trained beginning with the intermediate data set, which has the smallest distance to the initial training data set in terms of characteristics, and is then trained with the next adjacent intermediate data set or target data set. Trainingsverfahren für ein künstliches neuronales Netzwerk nach einem der vorstehenden Ansprüche, wobei das künstliche neuronale Netzwerk entsprechend der Reihenfolge gemäß Anspruch 6 trainiert wird, wobei das künstliche neuronale Netzwerk mittels des Ausgangstrainingsdatensatz und/oder mittels einem bereits trainierten Zwischendatensatz nachtrainiert wird.The training method for an artificial neural network according to one of the preceding claims, wherein the artificial neural network according to the order according to Claim 6 is trained, the artificial neural network being retrained using the initial training data set and / or using an already trained intermediate data set. Trainingsverfahren für ein künstliches neuronales Netzwerk nach einem der vorstehenden Ansprüche, wobei der Zieldatensatz und/oder der Zwischendatensatz in einem geringeren Detailgrad mit Informationen versehen ist als der Ausgangstrainingsdatensatz, wobei insbesondere der Zieldatensatz und/oder der Zwischendatensatz nicht mit Informationen versehen sind.Training method for an artificial neural network according to one of the preceding claims, wherein the target data set and / or the intermediate data set is provided with information in a lower level of detail than the initial training data set, wherein in particular the target data set and / or the intermediate data set are not provided with information. Trainingsverfahren für ein künstliches neuronales Netzwerk nach einem der vorstehenden Ansprüche, wobei der Ausgangstrainingsdatensatz, der Zieldatensatz und der Zwischendatensatz Bilddaten umfassen.The training method for an artificial neural network according to one of the preceding claims, wherein the initial training data set, the target data set and the intermediate data set comprise image data. Trainingsverfahren für ein künstliches neuronales Netzwerk nach einem der vorstehenden Ansprüche, wobei die Charakteristik ein zeitveränderlicher Parameter ist und sich die Charakteristik des Ausgangstrainingsdatensatz während einer Zeitspanne zu der Charakteristik des Zwischendatensatz bzw. des Zieldatensatz verändert.Training method for an artificial neural network according to one of the preceding claims, wherein the characteristic is a time-varying parameter and the characteristic of the initial training data set changes over a period of time to the characteristic of the intermediate data set or the target data set. Trainingsverfahren für ein künstliches neuronales Netzwerk nach Anspruch 10, wobei die Charakteristik ein Helligkeitswert von Bilddaten u/o ein Intensitätswert ist.Training method for an artificial neural network according to Claim 10 , wherein the characteristic is a brightness value of image data and / o an intensity value. Trainingsverfahren für ein künstliches neuronales Netzwerk nach einem der vorstehenden Ansprüche, wobei das künstliche neuronale Netzwerk, welches mittels dem Ausgangstrainingsdatensatz trainiert ist, als erstes künstliches neuronales Netzwerk gespeichert wird und eine Kopie des ersten künstlichen neuronalen Netzwerks mittels des Verfahrens nach einem der vorstehenden Ansprüche trainiert wird und als zweites künstliches neuronales Netzwerk gespeichert wird und ein Klassifikator trainiert wird, der eingerichtet ist, zu entscheiden, ob das erste künstliche neuronale Netzwerk oder das zweite künstliche neuronale Netzwerk geeignet ist, Ausgangsdaten zu bestimmten Eingangsdaten zu ermitteln.Training method for an artificial neural network according to one of the preceding claims, wherein the artificial neural network which is trained using the initial training data set is stored as the first artificial neural network and a copy of the first artificial neural network is trained using the method according to one of the preceding claims and is stored as the second artificial neural network and a classifier is trained which is set up to decide whether the first artificial neural network or the second artificial neural network is suitable for determining output data for specific input data. Trainingsverfahren für ein künstliches neuronales Netzwerk, wobei wenigstens ein Zwischendatensatz und/oder der Zieldatensatz mittels eines GAN bereitgestellt werden.Training method for an artificial neural network, with at least one intermediate data set and / or the target data set being provided by means of a GAN. Fahrerassistenzsystem mit einem künstlichen neuronalen Netzwerk, welches mit einem Trainingsverfahren nach einem der vorstehenden Ansprüche trainiert wurde.Driver assistance system with an artificial neural network which was trained with a training method according to one of the preceding claims. Computerprogrammprodukt, das ausgeführt ist, in einen Speicher eines Computers geladen zu werden und das Softwarecodeabschnitte umfasst, mit denen die Schritte des Verfahrens nach einem der vorstehenden Ansprüche 1-13 ausgeführt werden, wenn das Computerprogrammprodukt auf dem Computer läuft.Computer program product which is designed to be loaded into a memory of a computer and which comprises software code sections with which the steps of the method according to one of the preceding Claims 1 - 13 be executed when the computer program product is running on the computer.
DE102019211672.8A 2019-08-02 2019-08-02 Training method for an artificial neural network Ceased DE102019211672A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102019211672.8A DE102019211672A1 (en) 2019-08-02 2019-08-02 Training method for an artificial neural network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102019211672.8A DE102019211672A1 (en) 2019-08-02 2019-08-02 Training method for an artificial neural network

Publications (1)

Publication Number Publication Date
DE102019211672A1 true DE102019211672A1 (en) 2021-02-04

Family

ID=74175057

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102019211672.8A Ceased DE102019211672A1 (en) 2019-08-02 2019-08-02 Training method for an artificial neural network

Country Status (1)

Country Link
DE (1) DE102019211672A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020200998A1 (en) 2020-01-28 2021-07-29 Zf Friedrichshafen Ag Processing of sensor data
DE102022201702A1 (en) 2022-02-18 2023-08-24 Zf Friedrichshafen Ag Computer-implemented method for protecting a machine learning model against deployment relocation, computer program, data carrier signal and automated transport system for transporting people and/or objects
DE102022205672B3 (en) 2022-06-02 2023-09-21 Zf Friedrichshafen Ag Protection against cybersecurity attacks on transmission control units

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RASHID, Tariq: part3_neural_network_mnist_data_with_rotations.ipynb. 2017. URL: https://raw.githubusercontent.com/makeyourownneuralnetwork/makeyourownneuralnetwork/master/part3_neural_network_mnist_data_with_rotations.ipynb, zu finden unter https://github.com/makeyourownneuralnetwork/makeyourownneuralnetwork/blob/master/part3_neural_network_mnist_data_with_rotations.ipynb; zu finden im Buch des Autors mit dem Titel Neuronale Netze selbst programmieren. 1. Auflage. O´Reilly. 2017. S.173-176 - ISBN 978-3-96009-043-4 [abgerufen am 11.05.2020] *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020200998A1 (en) 2020-01-28 2021-07-29 Zf Friedrichshafen Ag Processing of sensor data
DE102022201702A1 (en) 2022-02-18 2023-08-24 Zf Friedrichshafen Ag Computer-implemented method for protecting a machine learning model against deployment relocation, computer program, data carrier signal and automated transport system for transporting people and/or objects
DE102022205672B3 (en) 2022-06-02 2023-09-21 Zf Friedrichshafen Ag Protection against cybersecurity attacks on transmission control units

Similar Documents

Publication Publication Date Title
DE202017102235U1 (en) training system
DE102019204139A1 (en) Training for artificial neural networks with better utilization of the learning data sets
DE102017218889A1 (en) Unarmed parameterized AI module and method of operation
DE102018201290A1 (en) METHOD FOR PRODUCING A COMPRESSED VERSION OF AN ARTIFICIAL NEURONAL NETWORK AND DEVICE AND STORAGE MEDIUM
EP3719811A1 (en) Consistency of data markings in medical image processing for cell classification
DE102019211672A1 (en) Training method for an artificial neural network
DE102021200643B3 (en) Method for environment recognition for semi-autonomous or autonomous driving functions of a motor vehicle using a neural network
DE102018205561A1 (en) Device for classifying signals
DE69404143T2 (en) DETECTION SYSTEM AND DETECTION METHOD
DE102021124252A1 (en) Neural network systems for abstract thinking
DE102020213057A1 (en) Method and device for checking an AI-based information processing system used in partially automated or fully automated control of a vehicle
WO2020064209A1 (en) Machine learning system and a method, a computer program and a device for creating the machine learning system
WO2023280531A1 (en) Computer-implemented method, computer programme, and device for generating a data-based model copy in a sensor
DE102020200998A1 (en) Processing of sensor data
EP0978052A1 (en) Computer-aided selection of training data for neural networks
EP4002217A1 (en) Method for reducing training data
DE102019217951A1 (en) Method and apparatus for determining a domain distance between at least two data domains
DE112020005759T5 (en) Method and system for determining task compatibility in neural networks
WO2021052677A1 (en) Fast quantised training of trainable modules
DE102019217952A1 (en) Method and device for providing a training data set for training an AI function on an unknown data domain
DE102022209248A1 (en) Anonymizing image data
DE102021207699A1 (en) Partial unsupervised training
DE102023205832A1 (en) Computer-implemented method and apparatus for generating training data and for training based on the generated training data
DE102023201113A1 (en) Computer-implemented method for training a machine learning algorithm and/or for generating at least one training image
WO2024078668A1 (en) Confidence-dependent image brightening

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final