Adimen artifizialean lan egiten duen Reka start-up enpresako sortzaileetako bat da. Enpresak punta-puntako hizkuntza-eredu multimodalak eraikitzen ditu. Gainera, Euskal Herriko Unibertsitateko ohorezko ikerlaria da, eta %20ko dedikazioarekin lan egiten du IXA ikerketa taldean. Horren aurretik, FAIR (Meta AI) ikerlaria izan zen. Euskal Herriko Unibertsitateko Informatika Fakultatean egin zuen doktoretza, eta Eneko Agirre eta Gorka Labaka zuzendaritzapean. DeepMind eta FAIRen ere behin aritu zen lanean, eta Googlen birritan.
2012an, informatikako gradua ikasten zuen bitartean, Apertium itzultzaile automatikoaren komunitatearekin lankidetzan aritu izan zen, Google Summer of Code udako ekimenean ere.[3] Ikasleek software libreko proiektuetan parte hartzeko ekimen bat da hori.
Geroago, 2014an, oraindik graduko ikaslea zela, Hizkuntzaren Prozesamendua irakasgaian aurkeztu zuen praktika bat geroago mugikorrerako Mitzuli app ospetsua bihurtu zen.[4] Testua, audio eta irudiak ere itzultzen zituen 50 hizkuntza-bikoteetarako, software librea zen eta 30.000 mila deskarga lortu zituen. Garai hartan Googlek bakarrik eskaintzen zuen zerbitzu hori eta Google-rena ez zen librea.[5][6][7][8][9][10]
2014an bertan aurkeztu zuen gradu-amaierako proiektuan ("Itzulpen-sistema hibridoen eraikuntza EBMT bidezko itzulpen partzialak erabiliz") beste urrats bat egin zuen itzulpen automatikoan. Lanaren helburua itzulpenak hobetzea zen, hainbat testu itzulitan agertzen ziren adibideak erabiliz (ingelesez Example Based Machine Translation, EBMT). Testuko entitateak (pertsona, erakunde edo tokien izenak) eta esaldia baino txikiagoak diren unitate sintaktikoak identifikatu, eta orokortzen zituen hasieran, eta gero datu horiek aurreprozesatu nddoren itzulpen partzial haiek esaldi mailan txertatzen zituen. Itzulpenak egiteko zeuden beste teknikekin (estatistikoekin edota erregeletan oinarritutakoekin) hibridatzeko mekanismo bat ere garatu zuen.[11][12] HAP/LAP masterra egin zuen gero, eta Ixa taldearen lankidetza-beka batekin aritu zen QTLeap proiektu europarrean.
2015an euskarazko eta gaztelaniazko izen+aditz konbinazioei buruzko informazioa biltzen duen Konbitzul datu-basea sortzen parte hartu zuen.[13]
2016an aurkeztu zuen master-tesian Itzulpen Automatikoa hobetzeko helburuarekin aztertu zuen nola txertatu hitzen adierazpen distribuzionala (word embedding) eta ikasketa automatikoa.[14][15][16] Geroago bere ikasketetan zehar Google, DeepMind eta Facebooken[17] bertan egonaldiak egin zituen eta 2020an defendatu zuen Ixa Taldearekin eginiko doktorego-tesia, zuzendariak Eneko Agirre eta Gorka Labaka izan zirela.[18] Doktore-tesiak Espainiako eta Europako tesirik onenaren saria jaso zuen 2021ean. [19][20][21][22]
Sekuentziatik sekuentziarako eredu neuronalaren etorrerak aurrerapen izugarria ekarri zuen itzulpen automatikoan. Horrek hobekuntza handia ekarri zuen itzulpen-sistema estandarretan eta horrela zenbait ingurunetan giza-itzulpenen kalitatearen maila lortu zuten lehenengoz. Hala ere, gaur egun dauden sistemek datu asko behar dute (gainbegiratze sakona), corpus paralelo gisa normalean milioika perpaus behar izaten dituzte. Baina harrigarria da, gizakiak ez du baldintza hori behar hizkuntza bat ikasteko. Eta gainera baldintza horrek arazo praktiko garrantzitsu bat planteatzen du euskara bezalako baliabide gutxiko hizkuntzekin itzulpenak egiteko.
Artetxeren tesiaren helburua datu paraleloen menpekotasun hori guztiz ezabatzea izan zen, corpus elebakarra baino beharko ez zuten “gainbegiratu gabeko itzulpen automatiko”ko sistemak eratzeko. Horretarako, lehenengo urrats batean bi hizkuntzatarako sortutako hitz-bektoreak (word embedding-ak) lerrokatzen zituen, beren arteko egitura-antzekotasunean oinarrituta.[14] Gero, bigarren urrats batean, lerrokatze horren emaitzak erabiltzen zituen itzulpen-sistema neuronal bat edo itzulpen-sistema estatistiko bat hasieratzeko, azken urratsean back-translationaren bidez hobetzen joango dena.[18]
Ikertzaile gazteentzako Espainiako Informatika Saria, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman zion nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[24][25] Mikel Artetxek saria jasotzeagatik eman zituen esker-hitzetan jolas dialektiko bat egin zuen teknologiak artean zituen mugak azpimarratzeko.[26]
2021: Ikertzaile gazteentzako Espainiako Informatika Saria, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman zion nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[24]
2018: CoNLL nazioarteko kongresuan artikulu onenaren saria.[27][28] Saritutako artikuluaren izenburua hau da: “Uncovering Divergent Linguistic Information in Word Embeddings with Lessons for Intrinsic and Extrinsic Evaluation”. Euskaraz: “Informazio linguistiko dibergentea azaleratzen hitzen bektore-errepresentazio distribuzionaletan, ebaluazio intrinseko eta estrinsekorako zenbait ikasgairekin”.
2017: Science aldizkariak albiste moduan jaso zuen Mikel Artetxe, Eneko Agirre and Gorka Labaka Ixakideek 2017ko urrian argitaratu zuten ikerketa bat: Artificial intelligence goes bilingual—without a dictionary. [29][30][16]
2014ko SWERC txapelketa. EHUko Informatika Fakultateko taldeak domina bat lortu zuen Jesús Ibañez, Adrián Nuñez, Eneko Pinzolas, Jon Mediero, Asier Mujika, Iván Matellanes eta Mikel Artetxe.2017: Bigarren saria Bartzelonan antolatu zen Hizkuntza Teknologietako Hackatoian. Antolatzailea Red.es izan zen, eta SESIAD agentziaren babesa izan zuen. Mikel Artetxe Linguee moduko aplikazioak sortzeko programa bat garatu zuen; testu-corpus batetik abiatuta hiztegi elebidunak sortzeko aplikazio harek testu errealetako adibide errealak eskaintzen zituen hitzaren erabilera zelakoa den hobeto erakustearren. Software librea zen aplikazio hura hainbat hizkuntzatarako erabili ahal da, tartean euskararako.[31]
2013-2014 ikasturteko karrera bukaerako sari nazionala ere jaso zuen, estatu mailakoa.[32][33]
2014: Mikel Artetxek hirugarren postua lortu zuen Tuenti challange programazio-txapelketan.[34]
2014: Domina bat eta 6. postua nazioarteko SWERC programazio-lehiaketan. Donostiako Informatika fakultateko taldeko kideak hauek ziren: Iván Matellanes, Asier Mujika, Mikel Artetxe, Adrián Nuñez, Jon Mediero, eta Eneko Pinzolas. Entrenatzailea Jesus Ibañez Conde irakaslea zen.[35][36]
15 artikulu baino gehiago argitaratu ditu punta-puntako nazioarteko kongresu eta aldizkarietan.[37]