[go: up one dir, main page]

DE10348920A1 - Computersystem und Verfahren zur mehrsprachigen assoziativen Suche - Google Patents

Computersystem und Verfahren zur mehrsprachigen assoziativen Suche Download PDF

Info

Publication number
DE10348920A1
DE10348920A1 DE10348920A DE10348920A DE10348920A1 DE 10348920 A1 DE10348920 A1 DE 10348920A1 DE 10348920 A DE10348920 A DE 10348920A DE 10348920 A DE10348920 A DE 10348920A DE 10348920 A1 DE10348920 A1 DE 10348920A1
Authority
DE
Germany
Prior art keywords
search
language
text
associative
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10348920A
Other languages
English (en)
Inventor
Eric Seewald
Gunter Dr. Buxbaum
Ralf Dr. Pakull
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Covestro Deutschland AG
Original Assignee
Bayer MaterialScience AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer MaterialScience AG filed Critical Bayer MaterialScience AG
Priority to DE10348920A priority Critical patent/DE10348920A1/de
Priority to US10/967,401 priority patent/US20050086214A1/en
Publication of DE10348920A1 publication Critical patent/DE10348920A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur mehrsprachigen assoziativen Suche mit folgenden Schritten: DOLLAR A - Eingabe eines Suchtextes in einer ersten Sprache, DOLLAR A - automatische Übersetzung des Suchtextes in eine zweite Sprache, DOLLAR A - Übernahme des in die zweite Sprache übersetzten Suchtextes in ein assoziatives Suchmodul, wobei das assoziative Suchmodul ein neuronales Netz oder einen vordefinierten Algorithmus beinhaltet, welches bzw. welcher zur Suche, basierend auf einem Suchtext, der zweiten Sprache ausgebildet ist.

Description

  • Die Erfindung betrifft ein Computersystem, ein Verfahren und ein digitales Speichermedium zur mehrsprachigen assoziativen Suche.
  • Die assoziative Suche ist ein an sich aus dem Stand der Technik bekanntes Verfahren. Im Gegensatz zu üblichen Datenbankabfrageverfahren wird bei der assoziativen Suche keine vorgegebene Abfragesprache zur Formulierung einer Suchanfrage verwendet, sondern eine Textpassage. In der Textpassage kann der Anwender eine Suchanfrage inhaltlich mit eigenen Worten oder Sätzen beschreiben.
  • Diese Art der Suche beruht entweder auf vorher festgelegten Algorithmen oder auf einem zuvor trainierten neuronalen Netz. Für das Training des neuronalen Netzes werden vorklassifizierte Beispieldokumente verwendet. Dabei dient der Text eines Beispieldokuments als Eingabeparameter für das neuronale Netz und die von dem neuronalen Netz ermittelte Klassifikation wird mit der vorgegebenen Klassifikation abgeglichen, um die Neuronen zu trainieren.
  • Eine entsprechende Software für die assoziative Suche ist kommerziell erhältlich von SER Systems AG, SER brainware (www.ser.de). Dieses Programm ermöglicht die assoziative Suche auf der Basis von beispielhaften Textpassagen. Die assoziative Suche bedient sich dabei eines zuvor in einem Klassifikationsmodus trainierten neuronalen Netzes. Der dabei verwendete Lernprozess wird auch als "Learning by Example" bezeichnet.
  • Ein Nachteil vorbekannter assoziativer Suchverfahren ist, dass die Suchanfrage nur in derselben Sprache formuliert werden kann, in der das neuronale Netz trainiert worden ist.
  • Der Erfindung liegt demgegenüber die Aufgabe zugrunde, ein verbessertes Verfahren für die assoziative Suche zu schaffen, welches eine mehrsprachige assoziative Suche ermöglicht. Ferner liegt der Erfindung die Aufgabe zugrunde, ein entsprechendes Computersystem und ein digitales Speichermedium zu schaffen.
  • Die der Erfindung zugrunde liegenden Aufgaben werden jeweils mit den Merkmalen der unabhängigen Patentansprüche gelöst. Bevorzugte Ausführungsformen der Erfindung sind in den abhängigen Patentansprüchen angegeben.
  • Die Erfindung schafft ein Verfahren zur mehrsprachigen assoziativen Suche, welches die Eingabe des Suchtextes in einer ersten Sprache ermöglicht, die von einer zweiten Sprache verschieden ist, in der das neuronale Netz des assoziativen Suchmoduls trainiert worden ist. Hierzu wird der Suchtext der ersten Sprache mittels automatischer Übersetzung in die zweite Sprache übersetzt und dann in das assoziative Suchmodul eingegeben. Es können dabei einfache auf Wort-zu-Wort-Äquivalenz basierende automatische Übersetzungsverfahren zum Einsatz kommen, aber auch weiterentwickelte Grammatik und Syntax berücksichtigende Übersetzungsverfahren verwendet werden.
  • Die Erfindung macht sich dabei den überraschenden Effekt zunutze, dass, obwohl automatische Übersetzungen, insbesondere auf Wort-zu-Wort-Äquivalenz basierende automatische Übersetzungen, relativ ungenau sind und mitunter kaum verständliche oder grammatikalisch fehlerhafte Übersetzungsergebnisse haben, dennoch ein solcher automatisch übersetzter Suchtext für eine assoziative Suche verwendet werden kann, ohne dass dies die Qualität der assoziativen Suche wesentlich beeinträchtigt.
  • Nach einer bevorzugten Ausführungsform der Erfindung wird die Sprache des Suchtextes automatisch erkannt. Solche automatischen Erkennungsverfahren sind an sich aus dem Stand der Technik bekannt und beispielsweise in Microsoft WORD implementiert. Der Benutzer kann also in einer beliebigen Sprache, die von dem System unterstützt wird, seinen Suchtext eingeben. Die Sprache des Suchtextes wird dann automatisch erkannt und es wird das für die Übersetzung von der Sprache des Suchtextes in die zweite Sprache erforderliche Übersetzungsmodul aufgerufen.
  • Nach einer weiteren bevorzugten Ausführungsform der Erfindung findet die assoziative Suche in Dokumenten unterschiedlicher Sprachen statt. Hierzu wird für jede der Sprachen ein neuronales Netz mit Beispieldokumenten der jeweiligen Sprache trainiert.
  • Vorzugsweise werden die Ergebnisse der verschiedenen assoziativen Suchen in einer einzigen sortierten Liste ausgegeben. Für die Sortierung der Liste können dabei so genannte Ranking-Werte oder Vertrauenswerte verwendet werden, die den Grad der Übereinstimmung des Suchtextes mit einem Treffer angeben.
  • Nach einer weiteren bevorzugten Ausführungsform der Erfindung werden Textdateien durch automatische Spracherkennung aus Sprachdateien gewonnen. In diesen Textdateien kann dann mit einem erfindungsgemäßen Verfahren recherchiert werden. Bei einer Sprachdatei handelt es sich beispielsweise um die Tondatei einer Multimediadatei, die z.B. auf einer DVD gespeichert ist.
  • Im Weiteren werden bevorzugte Ausführungsbeispiele der Erfindung mit Bezugnahme auf die Zeichnungen näher erläutert. Es zeigen:
  • 1 ein Blockdiagramm einer ersten Ausführungsform eines erfindungsgemäßen Computersystems,
  • 2 ein Flussdiagramm einer ersten Ausführungsform eines erfindungsgemäßen Verfahrens,
  • 3 ein Blockdiagramm einer zweiten Ausführungsform eines erfindungsgemäßen Computersystems mit mehreren sprachspezifischen neuronalen Netzen,
  • 4 ein Flussdiagramm einer zweiten Ausführungsform eines erfindungsgemäßen Verfahrens zur Durchführung einer assoziativen Suche basierend auf mehreren in verschiedenen Sprachen trainierten neuronalen Netzen.
  • Die 1 zeigt ein Computersystem 100 zur Durchführung einer assoziativen Suche in einer Datenbank 102. Das Computersystem 100 hat eine Nutzerschnittstelle 104 zur Eingabe eines Suchtextes in einer Eingabesprache SE. Das Computersystem 100 hat ferner ein Übersetzungsmodul 106 für die automatische Übersetzung von der Eingabesprache SE in eine Zielsprache SZ.
  • Grundsätzlich kann es sich bei dem Übersetzungsmodul 106 um ein beliebiges Übersetzungsprogramm handeln. Vorzugsweise wird ein auf Wort-zu-Wort-Äquivalenz basierendes Übersetzungsverfahren eingesetzt. Solche Übersetzungsverfahren werden in kommerziell erhältlichen Sprachcomputern eingesetzt und sind an sich aus dem Stand der Technik bekannt.
  • Das Computersystem 100 hat ferner ein assoziatives Suchmodul 108, welches ein neuronales Netz 110 beinhaltet. Das neuronale Netz 110 ist mit von einem Benutzer kategorisierten Dokumenten der Zielsprache SZ in einem Klassifikationsmodus trainiert worden.
  • Wenn in das assoziative Suchmodul 108 ein Suchtext in der Zielsprache SZ eingegeben wird, werden Dokumente der Datenbank 102 mittels des neuronalen Netzes 110 ermittelt, die zu der durch den Suchtext passenden Kategorie gehören. Zusätzlich wird für jeden der "Treffer" ein so genannter Ranking-Wert ausgegeben, der den Grad der Übereinstimmung zwischen dem Suchtext und dem Treffer angibt. Die entsprechende Trefferliste wird vorzugsweise nach den Ranking-Werten sortiert und über die Nutzerschnittstelle 104 als Trefferliste 112 ausgegeben.
  • Beim Betrieb des Computersystems 100 gibt ein Benutzer über die Nutzerschnittstelle 104 einen Eingabetext in der Eingabesprache SE ein. Bei dem Suchtext kann es sich um eine Suchanfrage handeln, in der der Anwender inhaltlich mit einigen Worten, Sätzen oder einer beispielhaften Textpassage, die zu suchenden Dokumente umschreibt.
  • Durch die Eingabe des Suchtextes in der Sprache SE wird das Übersetzungsmodul 106 gestartet, welches den Suchtext automatisch in die Zielsprache SZ übersetzt. Der übersetzte Suchtext wird dann in das assoziative Suchmodul 108 eingegeben.
  • Mittels des neuronalen Netzes 110 werden dann in einem Extraktionsmodus zu dem Suchtext ähnliche Dokumente der Datenbank 102 identifiziert und mit einem Ranking-Wert bewertet. Die entsprechenden Ergebnisse werden als Trefferliste 112 ausgegeben, wobei jedes Element der Trefferliste beispielsweise ein Hyperlink auf das betreffende Dokument der Datenbank 102 sein kann.
  • Die 2 zeigt ein entsprechendes Flussdiagramm. In dem Schritt 200 gibt ein Benutzer einen Suchtext in einer Eingabesprache SE ein. Daraufhin erfolgt in dem Schritt 202 die automatische Übersetzung des Suchtextes von der Eingabesprache SE in eine Zielsprache SE. Vorzugsweise erfolgt diese automatische Übersetzung mit einem relativ einfachen auf Wort-zu-Wort-Äquivalenz basierenden Übersetzungsverfahren.
  • In dem Schritt 204 wird der in die Zielsprache SZ übersetzte Suchtext in ein assoziatives Suchmodul eingegeben, welches ein mit Dokumenten der Zielsprache SZ trainiertes neuronales Netz aufweist. In dem Schritt 206 erfolgt die Durchführung der assoziativen Suche mit dem neuronalen Netz. Neben den eigentlichen Treffern ermittelt das neuronale Netz für jeden der Treffer auch einen Ranking- oder Vertrauenswert (Schritt 208). In dem Schritt 210 erfolgt die Ausgabe der nach Ranking sortierten Trefferliste.
  • Von besonderem Vorteil bei der Verwendung eines auf Wort-zu-Wort-Äquivalenz beruhenden Übersetzungsverfahrens ist, dass einerseits die Qualität der Übersetzung für die Zwecke der assoziativen Suche ausreichend ist und dass andererseits die für die Übersetzung erforderliche Zeit minimal ist. Dies ist für eine benutzerfreundliche Durchführung von Datenbankabfragen wesentlich, da insbesondere aus softwareergonomischen Gründen die Latenzzeit zwischen der Eingabe des Suchtextes und der Ausgabe der Trefferliste möglichst gering sein sollte.
  • Die 3 zeigt ein Blockdiagramm eines Computersystems 300. Elemente der 3, die Elementen der 1 entsprechen, sind mit um 200 erhöhten Bezugszeichen gekennzeichnet.
  • Im Unterschied zu der Ausführungsform der 1 ermöglicht die Nutzerschnittstelle 304 die Eingabe eines Suchtextes in einer beliebigen Sprache SEC, die von dem Computersystem 300 unterstützt wird, wobei 0 < j ≤ m. Beispielsweise unterstützt das Computersystem 300 Suchanfragen in Deutsch, Englisch, Französisch, Japanisch und Russisch, d. h. m = 5.
  • Die Nutzerschnittstelle 304 ist mit einem Spracherkennungsmodul 305 verknüpft. Das Spracherkennungsmodul 305 erkennt automatisch die Eingabesprache SEj, in der der Nutzer über die Nutzerschnittstelle 304 den Eingabetext eingegeben hat. Das Spracherkennungsmodul 305 ist mit einem Übersetzungsmodul 306 verknüpft.
  • Das Übersetzungsprogramm 307 hat für jede der m verschiedenen von dem Computersystem 300 unterstützten Eingabesprachen SEj eine entsprechende Übersetzungskomponente 314. Jede der Übersetzungskomponenten 314 hat eine Anzahl von n Übersetzungsmodulen 306 für die automatische Übersetzung der Eingabesprache SEj in eine der von dem Computersystem 300 unterstützten Zielsprachen SZi, wobei 0 < i ≤ n.
  • Im Weiteren wird ohne Beschränkung der Allgemeinheit davon ausgegangen, dass die Anzahl m der vom Computersystem 300 unterstützten Eingabesprachen gleich der Anzahl n der unterstützten Zielsprachen ist, und dass außerdem die Eingabesprachen mit den Zielsprachen identisch sind. In diesem Fall beinhaltet jede der Übersetzungskomponenten 314 eine Anzahl von m–1 Übersetzungsmodulen 306 zur Übersetzung von der jeweiligen Eingabesprache in die anderen Zielsprachen.
  • Beispielsweise hat also die Übersetzungskomponente 314 der Eingabesprache Deutsch SEl Übersetzungsmodule 306 für die automatische Übersetzung in die Zielsprachen Englisch, Französisch, Japanisch und Russisch. Entsprechen verhält es sich für die anderen Übersetzungskomponenten 314, die jeweils einer anderen der Eingabesprachen zugeordnet sind.
  • Das Übersetzungsprogram 307 ist mit einem assoziativen Suchmodul 308 verknüpft. Das assoziative Suchmodul 308 hat für jede der Zielsprachen ein neuronales Netz 310, welches mit kategorisierten Dokumenten der jeweiligen Zielsprache trainiert worden ist. In dem betrachteten Beispielsfall hat das assoziative Suchmodul 308 also eine Anzahl von m verschiedenen neuronalen Netzen 310, wobei jedes der neuronalen Netze 310 einer der von dem Computersystem 300 unterstützten Sprachen zugeordnet ist. Entsprechend beinhaltet die Datenbank 302 Dokumente dieser verschiedenen Sprachen, in denen mittels assoziativer Suche gesucht werden kann. Alternativ können die Dokumente in mehreren Datenbanken verteilt gespeichert sein.
  • Beim Betrieb des Computersystems 300 gibt der Benutzer über die Nutzerschnittstelle 304 einen Eingabetext in einer der vom Computersystem 300 unterstützten Eingabesprachen SEj ein. Die Eingabesprache wird daraufhin von dem Spracherkennungsmodul 305 automatisch erkannt. Dann wird die der Eingabesprache zugeordnete Übersetzungskomponente 314 gestartet, sodass der Suchtext mittels der Übersetzungsmodule 306 der betreffenden Übersetzungskomponente 314 in die verschiedenen von der Eingabesprache unterschiedlichen Zielsprachen SZi mit i ≠ j übersetzt wird.
  • Die verschiedenen Übersetzungen des Suchtextes werden dann zur Grundlage der entsprechenden assoziativen Suchen durch die neuronalen Netze 310 gemacht. Ferner wird auch der Suchtext der Eingabesprache für die assoziative Suche mittels einer der neuronalen Netze 310 verwendet, da die Eingabesprache ja in dem hier betrachteten Beispielsfall auch gleichzeitig eine der Zielsprachen ist. Die Ergebnisse der einzelnen assoziativen Suchen werden dann in einer sortierten Trefferliste 312 über die Nutzerschnittstelle 304 ausgegeben.
  • Wenn ein Benutzer also beispielsweise einen Suchtext in Deutsch SE1 über die Nutzerschnittstelle 304 eingibt, so wird Deutsch als Eingabesprache SE1 von dem Spracherkennungsmodul 305 automatisch erkannt. Daraufhin wird von dem Spracherkennungsmodul 305 die Übersetzungskomponente 314 des Übersetzungsmoduls 307, welche der Eingabesprache Deutsch SE1 zugeordnet ist, gestartet. Daraufhin wird der Suchtext durch die verschiedenen Übersetzungsmodule 306 in die Zielsprachen Englisch, Französisch, Japanisch und Russisch übersetzt.
  • Ferner wird der Originalsuchtext in das der deutschen Sprache zugeordnete neuronale Netz 310 für die Durchführung einer assoziativen Suche eingegeben. Entsprechend werden die nach Englisch, Französisch, Japanisch und Russisch übersetzten Suchtexte in die den jeweiligen Sprachen zugeordneten neuronalen Netze 310 des assoziativen Suchmoduls 308 eingegeben. Die entsprechenden in der jeweiligen Sprache aufgefundenen Treffer werden vorzugsweise in einer gemeinsamen Trefferliste 312 ausgegeben, die nach den Ranking-Werten sortiert ist.
  • Die 4 zeigt ein entsprechendes Flussdiagramm. In dem Schritt 400 wird ein Suchtext in einer der von dem System unterstützten Sprachen SEj eingegeben. In dem Schritt 402 wird die Eingabesprache automatisch erkannt und danach die Übersetzung in die von der Eingabesprache verschiedenen Zielsprachen in dem Schritt 404 gestartet. Vorzugsweise wird dabei ein Übersetzungsverfahren basierend auf Wort-zu-Wort-Äquivalenz verwendet.
  • Die in die verschiedenen Zielsprachen übersetzten Suchtexte sowie auch der Suchtext in der Eingabesprache – wenn es sich bei der Eingabesprache um eine der Zielsprachen handelt – werden in dem Schritt 406 in das assoziative Suchmodul eingegeben.
  • Danach werden in den parallel ablaufenden Schritten 408, 410, 412, jeweils assoziative Suchen nach Dokumenten der verschiedenen Zielsprachen durchgeführt. Beispielsweise wird in dem Schritt 408 eine Suche nach Dokumenten der Zielsprache SZ1 mit Hilfe des in die Zielsprache SZ1 übersetzten Eingabetextes durchgeführt. Entsprechend wird in dem Schritt 410 eine Suche nach Dokumenten der Zielsprache SZ2 mit Hilfe des in die Zielsprache SZ2 übersetzten Suchtextes durchgeführt, usw.
  • In den entsprechenden Schritten 414, 416, 418, ... wird jeweils ein Ranking-Wert für jeden der ermittelten Treffer berechnet. In dem Schritt 420 werden die Treffer nach Ranking-Werten sortiert und in dem Schritt 422 in einer einzigen Trefferliste ausgegeben.
  • 100
    Computersystem
    102
    Datenbank
    104
    Nutzerschnittstelle
    106
    Übersetzungsmodul
    108
    assoziatives Suchmodul
    110
    neuronales Netz
    112
    Trefferliste
    300
    Computersystem
    302
    Datenbank
    304
    Nutzerschnittstelle
    306
    Übersetzungsmodul
    307
    Übersetzungsprogramm
    308
    assoziatives Suchmodul
    310
    neuronales Netz
    312
    Trefferliste
    305
    Spracherkennungsmodul
    314
    Übersetzungskomponente

Claims (17)

  1. Verfahren zur mehrsprachigen assoziativen Suche mit folgenden Schritten: – Eingabe eines Suchtextes in einer ersten Sprache, – automatische Übersetzung des Suchtextes in eine zweite Sprache, – Übernahme des in die zweite Sprache übersetzten Suchtextes in ein assoziatives Suchmodul, wobei das assoziative Suchmodul ein neuronales Netz oder einen vordefinierten Algorithmus beinhaltet, welches bzw. welcher zur Suche basierend auf einem Suchtext der zweiten Sprache ausgebildet ist.
  2. Verfahren nach Anspruch 1 mit folgenden weiteren Schritten: – automatische Erkennung der ersten Sprache, – Aufruf eines Programmmoduls für die automatische Übersetzung von der ersten in die zweite Sprache aus einer Menge von Programmmodulen für die automatische Übersetzung zwischen verschiedenen Sprachen.
  3. Verfahren nach Anspruch 1 oder 2, wobei durch das neuronale Netz ein Ranking-Wert für jedes Suchergebnis ermittelt wird.
  4. Verfahren nach Anspruch 1, 2 oder 3, wobei die automatische Übersetzung von der ersten Sprache in verschiedene zweite Sprachen erfolgt, und für jede der verschiedenen zweiten Sprachen ein zur Suche in der jeweiligen Sprache trainiertes neuronales Netz verwendet wird.
  5. Verfahren nach Anspruch 4, wobei die Suchergebnisse der neuronalen Netze in einer nach Ranking-Werten sortierten Liste ausgegeben werden.
  6. Verfahren nach einem der vorhergehenden Ansprüche 1 bis 5, wobei das bzw. die neuronalen Netze mit Textdateien trainiert worden sind.
  7. Verfahren nach Anspruch 6, wobei die Textdateien durch automatische Spracherkennung aus Sprachdateien gewonnen worden sind.
  8. Verfahren nach einem der vorhergehenden Ansprüche 1 bis 7, wobei die automatische Übersetzung basierend auf Wort-zu-Wort-Äquivalenz durchgeführt wird.
  9. Digitales Speichermedium für eine mehrsprachige assoziative Suche, mit Programmmitteln zur Durchführung der folgenden Schritte: – Eingabe eines Suchtextes in einer ersten Sprache, – automatische Übersetzung des Suchtextes in eine zweite Sprache, – Eingabe des in die zweite Sprache übersetzten Suchtextes in ein assoziatives Suchmodul, wobei das assoziative Suchmodul ein neuronales Netz beinhaltet, welches zur Suche basierend auf einem Suchtext der zweiten Sprache trainiert ist.
  10. Digitales Speichermedium nach Anspruch 9, mit Programmmodulen für die automatische Übersetzung zwischen verschiedenen Sprachen, wobei die Programmmittel zur automatischen Erkennung der ersten Sprache und zur Auswahl von zumindest einem der Programmmodule für die Übersetzung in die zweite Sprache ausgebildet sind.
  11. Digitales Speichermedium nach Anspruch 9 oder 10, wobei die Programmmittel zur automatischen Übersetzung des Suchtextes in mehrere verschiedene Sprachen ausgebildet sind und für die assoziative Suche jeweils ein in der jeweiligen Sprache trainiertes neuronales Netz verwendet wird.
  12. Digitales Speichermedium nach Anspruch 11, wobei die Programmmittel zur Sortierung der Suchergebnisse der verschiedenen neuronalen Netze ausgebildet sein.
  13. Digitales Speichermedium nach einem der vorhergehenden Ansprüche 9 bis 12, wobei die Programmmittel zur Durchführung der automatischen Übersetzung basierend auf Wort-zu-Wort-Äquivalenz ausgebildet sind.
  14. Computersystem zur mehrsprachigen assoziativen Suche mit: – Mitteln (104; 304) zur Eingabe eines Suchtextes in einer ersten Sprache, – Mitteln (106; 306, 307, 314) zur automatischen Übersetzung des Suchtextes in eine zweite Sprache, – einem assoziativen Suchmodul (108; 308) mit einem neuronalen Netz (110, 310), wobei das neuronale Netz zur Durchführung einer assoziativen Suche basierend auf einem Suchtext der zweiten Sprache trainiert ist.
  15. Computersystem nach Anspruch 14, mit Mitteln (305) zur automatischen Erkennung der ersten Sprache und mit Mitteln zur Auswahl eines Programmmoduls (306, 314) aus einer Menge von Programmmodulen für die automatische Übersetzung von der ersten in die zweite Sprache.
  16. Computersystem nach Anspruch 14 oder 15, mit mehreren neuronalen Netzen (310), die jeweils für eine assoziative Suche basierend auf Suchtexten verschiedener Sprachen trainiert worden sind.
  17. Computersystem nach Anspruch 14, 15 oder 16, wobei die Mittel zur automatischen Übersetzung zur Durchführung der automatischen Übersetzung basierend auf Wort-zu-Wort-Äquivalenz ausgebildet sind.
DE10348920A 2003-10-21 2003-10-21 Computersystem und Verfahren zur mehrsprachigen assoziativen Suche Withdrawn DE10348920A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10348920A DE10348920A1 (de) 2003-10-21 2003-10-21 Computersystem und Verfahren zur mehrsprachigen assoziativen Suche
US10/967,401 US20050086214A1 (en) 2003-10-21 2004-10-18 Computer system and method for multilingual associative searching

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10348920A DE10348920A1 (de) 2003-10-21 2003-10-21 Computersystem und Verfahren zur mehrsprachigen assoziativen Suche

Publications (1)

Publication Number Publication Date
DE10348920A1 true DE10348920A1 (de) 2005-05-25

Family

ID=34484873

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10348920A Withdrawn DE10348920A1 (de) 2003-10-21 2003-10-21 Computersystem und Verfahren zur mehrsprachigen assoziativen Suche

Country Status (2)

Country Link
US (1) US20050086214A1 (de)
DE (1) DE10348920A1 (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
US7428537B2 (en) * 2005-05-23 2008-09-23 Tyloon, Inc Searching method and system for commercial information
DE102006060173A1 (de) * 2006-12-18 2008-04-10 Zettwerk Software Engineering Gmbh Rekursives sprachübergreifendes Recherche-System
US8473276B2 (en) 2008-02-19 2013-06-25 Google Inc. Universal language input
US7698688B2 (en) 2008-03-28 2010-04-13 International Business Machines Corporation Method for automating an internationalization test in a multilingual web application
US8032469B2 (en) * 2008-05-06 2011-10-04 Microsoft Corporation Recommending similar content identified with a neural network
US8738354B2 (en) * 2009-06-19 2014-05-27 Microsoft Corporation Trans-lingual representation of text documents
US8515731B1 (en) * 2009-09-28 2013-08-20 Google Inc. Synonym verification
US8862661B2 (en) * 2010-04-29 2014-10-14 Hewlett-Packard Development Company, L.P. Processing content in a plurality of languages
US8463592B2 (en) * 2010-07-27 2013-06-11 International Business Machines Corporation Mode supporting multiple language input for entering text
CN103488648B (zh) * 2012-06-13 2018-03-20 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
KR102206588B1 (ko) * 2016-05-06 2021-01-22 이베이 인크. 인공신경망 기계 번역시 메타 정보를 이용하는 기법
CN112163103A (zh) * 2020-09-29 2021-01-01 北京字跳网络技术有限公司 搜索目标内容的方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6405195B1 (en) * 1996-05-06 2002-06-11 Spotfire Ab System and method for collaborative hosted analysis of data bases via a network portal
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US7146358B1 (en) * 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
WO2004042615A1 (en) * 2002-09-30 2004-05-21 Ning-Ping Chan Blinking annotation callouts highlighting cross language search results

Also Published As

Publication number Publication date
US20050086214A1 (en) 2005-04-21

Similar Documents

Publication Publication Date Title
DE69622565T2 (de) Verfahren und vorrichtung zur dynamischen anpassung eines spracherkennungssystems mit grossem wortschatz und zur verwendung von einschränkungen aus einer datenbank in einem spracherkennungssystem mit grossem wortschatz
DE60304331T2 (de) Abrufen übereinstimmender dokumente durch abfragen in einer nationalen sprache
DE69804495T2 (de) Informationsmanagement und wiedergewinnung von schlüsselbegriffen
DE69330633T2 (de) Verfahren und Apparat zum Vergleichen von semantischen Mustern für das Wiederauffinden von Texten
DE69712216T2 (de) Verfahren und gerät zum übersetzen von einer sparche in eine andere
DE69911842T2 (de) Verfahren und Vorrichtung zum Wiederauffinden von Information und entsprechendes Speichermedium
Bartsch et al. Towards a Firthian notion of collocation
DE69923191T2 (de) Interaktive anwenderschnittstelle mit spracherkennung und natursprachenverarbeitungssystem
DE60005326T2 (de) Erkennungseinheiten mit komplementären sprachmodellen
DE60016722T2 (de) Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars
DE69427848T2 (de) Unterstützungssystem zur Herstellung von Wörterbüchern
DE4232507A1 (de) Verfahren zum Kennzeichnen, Wiederauffinden und Sortieren von Dokumenten
EP0792492A1 (de) Verfahren zur erzeugung von deskriptoren für die klassifikation von texten
DE202005022113U1 (de) Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
DE10348920A1 (de) Computersystem und Verfahren zur mehrsprachigen assoziativen Suche
WO2006111230A1 (de) Verfahren zur gezielten ermittlung eines vollständigen eingabedatensatzes in einem sprachdialogsystem
DE112021006602T5 (de) Verfeinern von abfrage-erzeugungsmustern
EP1097447A1 (de) Verfahren und vorrichtung zur erkennung vorgegebener schlüsselwörter in gesprochener sprache
DE69909360T2 (de) Verfahren und System um Dokumente über eine elektronische Datei wiederaufzufinden
EP0814457B1 (de) Verfahren zur automatischen Erkennung eines gesprochenen Textes
WO2010078859A1 (de) Verfahren und system zum ermitteln einer ähnlichkeit von dokumenten
EP2034472A1 (de) Spracherkennungsverfahren und Spracherkennungsvorrichtung
EP1340169B1 (de) Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine
EP2221735A2 (de) Verfahren zum automatischen Klassifizieren eines Textes durch ein Computersystem
DE102005008803A1 (de) Verfahren und Computereinheit zum Ermitteln von Computer-Servicenamen

Legal Events

Date Code Title Description
8130 Withdrawal