Uyghur Latin Scripts files of THUYG-20(A free Uyghur speech database Released by CSLT@Tsinghua University & Xinjiang University).
THUYG-20 is using scripts not Uyghur Arabic script nor Uyghur Latin scripts. This repository is using Uyghur Latin Scripts for audio files. For audio files please download data_thuyg20.tar.gz [2.1G] ( speech data and transcripts for speech recognition ) form (http://www.openslr.org/22/) .
You can develop Uyghur speech recognition system using this files with THUYG-20 speech database.
THUYG-20: http://www.openslr.org/22/
THUYG-20(A free Uyghur speech database Released by CSLT@Tsinghua University & Xinjiang University)は音声認識のための音声データセットですが、音声ファイルのテキストには英文字を使用した独自のものを使用していました。 このリポジトリはTHUYG-20のテキストを標準のウイグルラテン文字に変換したものです。
音声ファイルはdata_thuyg20.tar.gz (speech data and transcripts for speech recognition )(2.1G)を使用してください。
これを使用してウイグル語音声認識システムを開発できます。