KR20040104701A - 패킷 네트워크 환경에서 음성의 트랜스코딩 - Google Patents
패킷 네트워크 환경에서 음성의 트랜스코딩 Download PDFInfo
- Publication number
- KR20040104701A KR20040104701A KR10-2004-7017694A KR20047017694A KR20040104701A KR 20040104701 A KR20040104701 A KR 20040104701A KR 20047017694 A KR20047017694 A KR 20047017694A KR 20040104701 A KR20040104701 A KR 20040104701A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- parameters
- bit
- stream
- transcoder
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/18—Service support devices; Network management devices
- H04W88/181—Transcoding devices; Rate adaptation devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/66—Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (31)
- 음성 신호로부터 생성된 제1 비트-스트림을 트랜스코딩할 수 있는 음성 트랜스코더에 있어서,제1 코딩 체계에 기초하여 인코드된 상기 제1 비트-스트림을 수신하도록 구성되며, 상기 제1 비트-스트림으로부터 제1의 다수의 음성 파라미터를 추출하고, 상기 제1 코딩 체계에 따라 상기 제1 비트-스트림을 디코드하고 다수의 제1 음성 샘플을 생성하는 디코더;상기 다수의 제1 음성 샘플 및 상기 다수의 제1 음성 파라미터를 수신하도록 구성되며, 제2 코딩 체계에 따라 사용하기 위해, 상기 다수의 제1 음성 샘플을 다수의 제2 음성 샘플로 변환하고, 상기 다수의 제1 음성 파라미터를 다수의 제2 음성 파라미터로 변환하는 컨버터; 및상기 다수의 제2 음성 샘플 및 상기 다수의 제2 음성 파라미터를 수신하도록 구성되며, 상기 제2 코딩 체계에 기초하여 인코드된 제2 비트-스트림을 생성하는 인코더를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 컨버터는 상기 다수의 제1 음성 샘플의 제1 프레임 사이즈를 제2 프레임 사이즈로 변환하고, 상기 인코더는 상기 제2 프레임 사이즈를 사용하여 상기 제2 코딩 체계에 따라 상기 제2 비트-스트림을 생성하는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 컨버터는 상기 다수의 제2 음성 파라미터를 상기 인코더에 전송하여 상기 인코더에 의한 파라미터의 재-평가를 회피하고, 이에 의해 지연을 감소시키는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 디코더는 포스트-필터 요소(post-filter element)를 포함하며, 상기 포스트-필터 요소가 디스에이블되는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 인코더는 잡음 억제기를 포함하며, 상기 잡음 억제기가 디스에이블되는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 다수의 제2 음성 파라미터는 상기 음성 신호의 에너지와 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 스펙트럼 특성과 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 피치와 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 피치 이득과 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 1항에 있어서, 상기 컨버터는 상기 다수의 제2 음성 파라미터를 상기 인코더에 전송하여 상기 인코더에 의한 파라미터의 재-평가(re-evaluation)를 회피하고, 이에 의해 상기 제2 비트-스트림으로부터 생성된 음성 신호의 감쇠(degradation)를 감소시키는 것을 특징으로 하는 음성 트랜스코더.
- 음성 신호로부터 생성된 제1 비트-스트림을 트랜스코딩하는 방법에 있어서,상기 제1 비트-스트림으로부터 다수의 제1 음성 파라미터를 추출하는 단계;다수의 제1 음성 샘플을 생성하기 위해 제1 코딩 체계에 따라 상기 제1 비트-스트림을 디코드하는 단계;상기 다수의 제1 음성 샘플을 제2 코딩 체계에 따라 사용하기 위해 다수의 제2 음성 샘플로 변환하는 단계;상기 다수의 제1 음성 파라미터를 제2 코딩 체계에 따라 사용하기 위해 다수의 제2 음성 파라미터로 변환하는 단계; 및상기 제2 코딩 체계에 기초하여 인코드된 제2 비트-스트림을 생성하기 위해 상기 다수의 제2 음성 파라미터에 기초하여 상기 다수의 제2 음성 샘플을 인코드하는 단계를 포함하는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 다수의 제1 음성 샘플의 제1 프레임 사이즈를 상기 제2 코딩 체계에 따라 사용하기 위해 제2 프레임 사이즈로 변환하는 단계를 더 포함하는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 다수의 제1 음성 파라미터를 상기 다수의 제2 음성 파라미터로 변환하는 상기 단계는 상기 인코딩 중에 파라미터의 재-평가를 회피하여 지연 및 복잡도를 감소시키도록 수행되는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 디코딩 중에 포스트-필터링을 디스에이블시키는 단계를 더 포함하는 것을 특징으로 하는 트랜스코딩 방법.
- 제11항에 있어서, 상기 인코딩 중에 잡음 제거를 디스에이블시키는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 다수의 제2 음성 파라미터는 상기 음성 신호의 에너지와 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 스펙트럼 특성과 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 피치와 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 피치 이득과 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 트랜스코딩 방법.
- 제 11항에 있어서, 상기 다수의 제1 음성 파라미터를 상기 다수의 제2 음성 파라미터로 변환하는 상기 단계는 상기 인코딩 중에 파라미터의 재-평가를 회피하고, 이에 의해 상기 제2 비트-스트림으로부터 생성된 음성 신호의 감쇠를 감소시키도록 수행되는 것을 특징으로 하는 트랜스코딩 방법.
- 음성 신호로부터 생성된 제1 비트-스트림을 트랜스코딩할 수 있는 음성 트랜스코더에 있어서,제1 코딩 체계에 기초하여 인코드된 상기 제1 비트-스트림을 수신하도록 구성되며, 상기 제1 코딩 체계에 따라 상기 제1 비트-스트림을 디코드하고 다수의 제1 음성 샘플을 생성하는 디코더;상기 다수의 제1 음성 샘플을 수신하도록 구성되며, 상기 다수의 제1 음성 샘플로부터 제1 다수의 음성 파라미터를 추출하는 파라미터 추출기 모듈;상기 다수의 제1 음성 샘플 및 상기 다수의 제1 음성 파라미터를 수신하도록 구성되며, 제2 코딩 체계에 따라 사용하기 위해, 상기 다수의 제1 음성 샘플을 변환 및 혼합하여 다수의 제2 음성 샘플을 생성하고, 상기 다수의 제1 음성 파라미터를 변환 및 혼합하여 다수의 제2 음성 파라미터를 생성하는 컨버터/믹서; 및상기 다수의 제2 음성 샘플 및 상기 다수의 제2 음성 파라미터를 수신하도록 구성되며, 상기 제2 코딩 체계에 기초하여 인코드된 제2 비트-스트림을 생성하는 인코더를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 컨버터는 상기 다수의 제2 음성 파라미터를 상기 인코더에 전송하여 상기 인코더에 의한 파라미터의 재-평가를 회피하고, 이에 의해지연을 감소시키는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 디코더는 포스트-필터 요소를 포함하며, 상기 포스트-필터 요소가 디스에이블되는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 인코더는 잡음 억제기를 포함하며, 상기 잡음 억제기가 디스에이블되는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 다수의 제2 음성 파라미터는 상기 음성 신호의 에너지와 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 스펙트럼 특성과 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 피치와 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 다수의 제1 음성 파라미터는 상기 음성 신호의 피치 이득과 관련된 적어도 하나의 파라미터를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 21항에 있어서, 상기 컨버터는 상기 다수의 제2 음성 파라미터를 상기 인코더에 전송하여 상기 인코더에 의한 파라미터의 재-평가를 회피하고, 이에 의해 상기 제2 비트-스트림으로부터 생성된 음성 신호의 감쇠를 감소시키는 것을 특징으로 하는 음성 트랜스코더.
- 음성 신호로부터 생성된 제1 비트-스트림을 트랜스코딩할 수 있는 음성 트랜스코더에 있어서,제1 코딩 체계에 기초하여 인코드된 상기 제1 비트-스트림을 수신하도록 구성되며, 상기 제1 코딩 체계에 따라 상기 제1 비트-스트림을 디코드하고 상기 비트-스트림으로부터 다수의 제1 음성 샘플을 생성하는 디코더;상기 다수의 제1 음성 샘플을 수신하도록 구성되며, 상기 다수의 제1 음성 샘플을 제2 코딩 체계에 따라 사용하기 위해 다수의 제2 음성 샘플로 변환하는 컨버터; 및상기 다수의 제2 음성 샘플을 수신하도록 구성되며, 상기 제2 코딩 체계에 기초하여 인코드된 제2 비트-스트림을 생성하는 인코더를 포함하는 것을 특징으로 하는 음성 트랜스코더.
- 제 30항에 있어서, 상기 컨버터는 상기 다수의 제1 음성 샘플의 제1 프레임 사이즈를 제2 프레임 사이즈로 변환하고, 상기 인코더는 상기 제2 프레임 사이즈를 사용하여 상기 제2 코딩 체계에 따라 상기 제2 비트-스트림을 생성하는 것을 특징으로 하는 음성 트랜스코더.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14553302A | 2002-05-13 | 2002-05-13 | |
US10/145,533 | 2002-05-13 | ||
PCT/US2003/006335 WO2003098598A1 (en) | 2002-05-13 | 2003-02-26 | Transcoding of speech in a packet network environment |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20040104701A true KR20040104701A (ko) | 2004-12-10 |
Family
ID=29548267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2004-7017694A KR20040104701A (ko) | 2002-05-13 | 2003-02-26 | 패킷 네트워크 환경에서 음성의 트랜스코딩 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP1504441A4 (ko) |
JP (1) | JP2005531017A (ko) |
KR (1) | KR20040104701A (ko) |
CN (1) | CN1653515A (ko) |
AU (1) | AU2003217859A1 (ko) |
IL (1) | IL165147A0 (ko) |
WO (1) | WO2003098598A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100945245B1 (ko) * | 2007-08-10 | 2010-03-03 | 한국전자통신연구원 | 안전하고 효율적인 음성 패킷 부분 암호화 방법 및 장치 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1544848B1 (en) * | 2003-12-18 | 2010-01-20 | Nokia Corporation | Audio enhancement in coded domain |
US7613607B2 (en) | 2003-12-18 | 2009-11-03 | Nokia Corporation | Audio enhancement in coded domain |
CN100369108C (zh) * | 2003-12-18 | 2008-02-13 | 诺基亚公司 | 编码域中的音频增强的方法和设备 |
JP4721355B2 (ja) * | 2006-07-18 | 2011-07-13 | Kddi株式会社 | 符号化データの符号化則変換方法および装置 |
US8416962B2 (en) | 2007-12-28 | 2013-04-09 | Panasonic Corporation | Audio mixing/reproducing device |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5694519A (en) * | 1992-02-18 | 1997-12-02 | Lucent Technologies, Inc. | Tunable post-filter for tandem coders |
FR2700087B1 (fr) * | 1992-12-30 | 1995-02-10 | Alcatel Radiotelephone | Procédé de positionnement adaptatif d'un codeur/décodeur de parole au sein d'une infrastructure de communication. |
JP3616432B2 (ja) * | 1995-07-27 | 2005-02-02 | 日本電気株式会社 | 音声符号化装置 |
US5771452A (en) * | 1995-10-25 | 1998-06-23 | Northern Telecom Limited | System and method for providing cellular communication services using a transcoder |
US5995923A (en) * | 1997-06-26 | 1999-11-30 | Nortel Networks Corporation | Method and apparatus for improving the voice quality of tandemed vocoders |
US6260009B1 (en) * | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
US7006787B1 (en) * | 2000-02-14 | 2006-02-28 | Lucent Technologies Inc. | Mobile to mobile digital wireless connection having enhanced voice quality |
-
2003
- 2003-02-26 KR KR10-2004-7017694A patent/KR20040104701A/ko not_active Application Discontinuation
- 2003-02-26 EP EP03713828A patent/EP1504441A4/en not_active Withdrawn
- 2003-02-26 WO PCT/US2003/006335 patent/WO2003098598A1/en not_active Application Discontinuation
- 2003-02-26 CN CNA03810962XA patent/CN1653515A/zh active Pending
- 2003-02-26 JP JP2004506009A patent/JP2005531017A/ja not_active Withdrawn
- 2003-02-26 AU AU2003217859A patent/AU2003217859A1/en not_active Abandoned
-
2004
- 2004-11-10 IL IL16514704A patent/IL165147A0/xx unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100945245B1 (ko) * | 2007-08-10 | 2010-03-03 | 한국전자통신연구원 | 안전하고 효율적인 음성 패킷 부분 암호화 방법 및 장치 |
US7953222B2 (en) | 2007-08-10 | 2011-05-31 | Electronics And Telecommunications Research Institute | Method and apparatus for partially encrypting speech packets |
Also Published As
Publication number | Publication date |
---|---|
WO2003098598A1 (en) | 2003-11-27 |
IL165147A0 (en) | 2005-12-18 |
EP1504441A1 (en) | 2005-02-09 |
CN1653515A (zh) | 2005-08-10 |
AU2003217859A1 (en) | 2003-12-02 |
JP2005531017A (ja) | 2005-10-13 |
EP1504441A4 (en) | 2005-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6463414B1 (en) | Conference bridge processing of speech in a packet network environment | |
EP1400139B1 (en) | Method for transcoding audio signals, network element, wireless communications network and communications system | |
CN101427551B (zh) | 会议端点的系统和方法 | |
US6138022A (en) | Cellular communication network with vocoder sharing feature | |
US6751477B1 (en) | Systems and methods for dynamically optimizing the fidelity of a speech signal received from a wireless telephony device and transmitted through a packet-switched network | |
US8271026B2 (en) | Mobile communication device providing N-way communication through a plurality of communication services | |
JP2001500344A (ja) | タンデム型ボコーダの音質を改良する方法および装置 | |
JP2006504300A (ja) | Celpパラメータ領域におけるdtmf検索と音声ミキシングのための方法及び装置 | |
US6697342B1 (en) | Conference circuit for encoded digital audio | |
FI106510B (fi) | Järjestelmä puheen siirtämiseksi matkapuhelinverkon ja kiinteän verkon päätelaitteen välillä | |
US8209187B2 (en) | Speech coding arrangement for communication networks | |
EP2572499B1 (en) | Encoder adaption in teleconferencing system | |
KR20040104701A (ko) | 패킷 네트워크 환경에서 음성의 트랜스코딩 | |
EP1365568A1 (en) | Method and system for tunneling wideband audio through the PSTN | |
US20040203802A1 (en) | Process for optimizing speech coding as a function of end user device characteristics | |
Hiwasaki et al. | A G. 711 embedded wideband speech coding for VoIP conferences | |
KR100917546B1 (ko) | Voip 환경에서의 음성 트랜스코딩 방법 및 장치 | |
US7715365B2 (en) | Vocoder and communication method using the same | |
US20030013465A1 (en) | System and method for pseudo-tunneling voice transmissions | |
US7460671B1 (en) | Encryption processing apparatus and method for voice over packet networks | |
EP1069738A1 (en) | A gateway comprising transcoding means | |
EP1083762A1 (en) | Mobile telecommunication terminal with a codec and additional decoders | |
US7170988B2 (en) | Method and apparatus for network communication | |
Marzuki et al. | Performances analysis of VoIP over 802.11 b and 802.11 e using different CODECs | |
Falsafi | High Definition Voice Rollout will Benefit all Mobile Users |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20041103 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20060425 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20060925 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20060425 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |