Script files of THUYG-20 Uyghur Speech Database

Uyghur Latin Scripts files of THUYG-20(A free Uyghur speech database Released by CSLT@Tsinghua University & Xinjiang University).

THUYG-20 is using scripts not Uyghur Arabic script nor Uyghur Latin scripts. This repository is using Uyghur Latin Scripts for audio files. For audio files please download data_thuyg20.tar.gz [2.1G] ( speech data and transcripts for speech recognition ) form (http://www.openslr.org/22/) .
You can develop Uyghur speech recognition system using this files with THUYG-20 speech database.

THUYG-20: http://www.openslr.org/22/

THUYG-20（A free Uyghur speech database Released by CSLT@Tsinghua University & Xinjiang University）は音声認識のための音声データセットですが、音声ファイルのテキストには英文字を使用した独自のものを使用していました。このリポジトリはTHUYG-20のテキストを標準のウイグルラテン文字に変換したものです。

音声ファイルはdata_thuyg20.tar.gz (speech data and transcripts for speech recognition )(2.1G)を使用してください。

これを使用してウイグル語音声認識システムを開発できます。

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
README.md		README.md
test_data.csv		test_data.csv
test_data_uey.csv		test_data_uey.csv
train_data _uey.csv		train_data _uey.csv
train_data.csv		train_data.csv
valid_data _uey.csv		valid_data _uey.csv
valid_data.csv		valid_data.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Script files of THUYG-20 Uyghur Speech Database

About

Releases

Packages

gheyret/thuyg20_scripts

Folders and files

Latest commit

History

Repository files navigation

Script files of THUYG-20 Uyghur Speech Database

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages