[go: up one dir, main page]

DE69429687T2 - System zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten - Google Patents

System zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten

Info

Publication number
DE69429687T2
DE69429687T2 DE69429687T DE69429687T DE69429687T2 DE 69429687 T2 DE69429687 T2 DE 69429687T2 DE 69429687 T DE69429687 T DE 69429687T DE 69429687 T DE69429687 T DE 69429687T DE 69429687 T2 DE69429687 T2 DE 69429687T2
Authority
DE
Germany
Prior art keywords
block
signal
block length
data
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69429687T
Other languages
English (en)
Other versions
DE69429687D1 (de
Inventor
Kenzo Akagiri
Makoto Mitsuno
Osamu Shimoyoshi
Hiroshi Suzuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of DE69429687D1 publication Critical patent/DE69429687D1/de
Publication of DE69429687T2 publication Critical patent/DE69429687T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Einrichtung zum Codieren eines Digitalsignals. Ausführungsformen der Erfindung beziehen sich auf das Aufzeichnen und/oder Wiedergeben oder Übertragen und/oder Empfangen von komprimierten Daten, beispielsweise bit- komprimierten digitalen Audiosignalen oder dgl., sowie auf einen Aufzeichnungsträger.
  • Unsere US-Patente US-A 5 243 588 und US-A 5 244 705 offenbaren ein Verfahren, welches aus einem Bit-komprimieren von digitalen Eingangsaudiosignalen und dem burstartigen bzw. explosionsartigen Aufzeichnen der bitkomprimierten Signale mit einem vorher-festgelegten Datenvolumen als Aufzeichnungseinheit besteht.
  • Dieses Verfahren beruht auf dem Anwenden einer magneto-optischen Platte als Aufzeichnungsträger und dem Aufzeichnen und/oder Wiedergeben von AD-PCM-Audiodaten (AD = adaptive differential), wie dies in Audiodatenformaten vorgeschrieben ist, beispielsweise bei CD-I (CD-Interaktive) oder CD-ROM XA. Die AD-PCM-Audiodaten werden burstartig auf der magneto-optischen Platte mit beispielsweise 32 Sektoren von den AD- PCM-Daten und wenigen Verknüpfungssektoren aufgezeichnet, um diese als eine Aufzeichnungseinheit zu verschachteln.
  • Es können mehrere Betriebsarten der AD-PCM-Audiodaten bei der Aufzeichnungs- und/oder Wiedergabeeinrichtung, bei der die magneto-optische Platte verwendet wird, ausgewählt werden. Beispielsweise sind eine Stufe A mit einem Kompressionsverhältnis, welches das zweifache von dem der herkömmlichen Compact-Disc (CD) beträgt und eine Abtastfrequenz von 37,8 kHz hat, eine Stufe B mit einem Kompressionsverhältnis, welches das vierfache von dem der herkömmlichen Compact Disc (CD) beträgt und eine Abtastfrequenz von 37,8 kHz hat, und eine Stufe C mit einem Kompressionsverhältnis, welches das achtfache von dem der herkömmlichen Compact Disc (CD) beträgt und eine Abtastfrequenz von 18,9 kHz hat, vorgeschrieben. Das heißt, daß bei der oben erwähnten Stufe B die digitalen Audiodaten auf ungefähr ein viertel des Originalvolumens komprimiert werden, wobei die Wiedergabezeit der Platte, die mit der B-Stufenbetriebsart aufgezeichnet ist, das vierfache von der des Standard-CD-Formats ist. Dies zeigt, daß eine Aufzeichnungs-/Wiedergabezeit ungefähr solang wie die, die mit einer Standardplatte mit einem Durchmesser von 12 cm erreicht wird, mit einer kleineren Platte erreicht werden kann und daher die Einrichtung bezüglich der Baugröße reduziert werden kann.
  • Da jedoch die Drehzahl der Platte die gleiche ist wie bei der Standard-CD, ist die Menge der komprimierten Daten, die mit der Stufe B pro voreingestellter Zeit erhalten wird, das vierfache von der der Standard-CD. Somit werden die gleichen komprimierten Daten in einer Zeiteinheit von beispielsweise einem Sektor oder einem Cluster viermal überlagert gelesen, und es wird lediglich ein Datenwort von vier überlagerten komprimierten Daten für die Audioreproduktion übertragen. Insbesondere wird während des Abtastens oder der Spurnachführung einer spiralförmigen Aufzeichnungsspur ein Spursprung, um zur Anfangsspurposition zurückzukehren, für jede Umdrehung durchgeführt, um die gleiche Spur schließlich viermal bei der Reproduktion mehrmalig nachzuführen. Dies zeigt, daß zumindest ein ton-komprimiertes Datenwort der vier überlagerten Leseoperationen ausreicht, und folglich das offenbarte Verfahren gegen Fehler äußerst effektiv ist, die durch Störungen verursacht werden, so daß dies vorzugsweise vor allem bei einem kleinen tragbaren Gerät angewandt werden kann.
  • Wir haben außerdem in unseren ebenfalls anhängigen US-Patentanmeldungen Serial Nos. 07/553 608 (angemeldet am 18 Juli 1990) und 07/664 300 (angemeldet am 4. März 1991) ein Verfahren vorgeschlagen, bei dem der Verarbeitungsblock während der Kompressionsverarbeitung als Antwort auf große Amplitudenänderungen der Eingangssignale geändert wird, um die zeitliche Auflösung und die Ansprechcharakteristik des Verarbeitungssystems zu verbessern.
  • Bei diesem Verfahren werden die zeitliche Auflösung und die Frequenzauflösung eines Verarbeitungssystems, die miteinander kollidieren, in Abhängigkeit von den Eigenschaften von Eingangssignalen geändert, um die Anpassungsfähigkeit an Eingangssignale zu verbessern und eine hohe Tonqualität zu erzeugen, die durch den Hörsinn wahrgenommen wird. Für die Transformationscodierung, bei der die orthogonale Transformation verwendet wird, ist beispielsweise eines von zahlreichen hochwirksamen Kompressionsverfahren besonders effektiv, um das Vorecho zu bekämpfen, welches erzeugt wird, wenn Eingangssignale, die heftige Änderungen der Signalamplitude aufweisen, geliefert werden. Der Ausdruck "Vorecho" wird verwendet, um ein Phänomen zu bezeichnen, gemäß dem, wenn Signale zu einem orthogonalen Transformationsblock komprimiert werden oder mit der orthogonalen Transformation oder inversen orthogonalen Transformation expandiert werden, während größere Amplitudenänderungen innerhalb des Transformationsblocks erzeugt werden, ein zeitlich gleichförmiges Quantisierungsrauschen im Block erzeugt wird, so daß das erzeugte Quantisierungsrauschen für den Hörsinn im kleinen Amplitudensignalbereich unangenehm ist, welches vor der orthogonalen Transformation oder der inversen orthogonalen Transformation vorhanden war.
  • Wenn bei der oben beschriebenen Transformationscodierung die zeitliche Länge des Transformationsblocks vermindert wird, wird die Frequenzantwort aufgrund der Eigenschaften der Orthogonal-Transformation abgesenkt, was eine Streuung des Spektrums oder der orthogonalen Transformationscodierung zur Folge hat. Wenn somit das Spektrum oder die orthogonalen Transformationskoeffizienten für die Signalkompression quantisiert werden, wird die Bitzuteilungswirksamkeit abgesenkt. Wenn daher die zeitliche Dauer des Orthogonal-Transformationsblocks übermäßig reduziert wird, um den Effekt des Vorechos zu vermindern, wird das Quantisierungsrauschen bis zu einem Grad vergrößert, daß dies durch den Hörsinn bemerkt werden kann. Aus dem obigen Grund muß die orthogonale Umformungsblockgröße durch eine Steuerung geändert werden, die auf Änderungen der Eingangssignale angepaßt ist. Zu diesem Zweck kann man schnell zu einem Konzept gelangen, die orthogonale Transformationsblockgröße mit einem Auge auf Amplitudenänderungen in der Schwingungsform im Zeitbereich zu steuern, der ein Eingangssignal zum betreffenden orthogonalen Transformationsblock ist (der orthogonalen Transformationsblock für die laufenden Eingangssignale). Die tatsächliche Eingangsschwingungsform im Zeitbereich ist jedoch hochkomplex. Die menschliche Hörempfindlichkeitscharakteristik kann außerdem auch als Einflußfaktor wirken. Die Folge davon ist, daß bei dem oben beschriebenen Verfahren die zeitliche Größe des orthogonalen Transformationsblocks dazu tendiert, als Antwort auf die tatsächlichen Eingangssignale vermindert zu werden, um eine relative Verschlechterung der Tonqualität zu bewirken.
  • Die WO 92/17 884 offenbart ein Codiergerät, bei dem Digitaldaten durch mehrere Abtastungen in Blöcken angeordnet sind und bei dem die Orthogonal-Transformation in jedem Block ausgeübt wird, um Koeffizientendaten zu erzeugen, die mit einer adaptiven Zahl von Bits codiert werden. Mehrere orthogonale Transformationseinheiten transformieren die Eingangsdigitaldaten mit unterschiedlichen Blocklängen. Lediglich eines der Ausgangssignale wird auf der Basis der Ausgangssignale der orthogonalen Transformationseinheiten ausgewählt. Das Gerät umfaßt eine Blocklängen-Entscheidungsschaltung, um die Blocklänge für die orthogonale Transformation eines jeden Bandes auf der Basis der Charakteristik von Blockdaten vor der Orthogonal-Transformation eines jeden Bandes festzulegen. Die Orthogonal-Transformation eines jeden Bandes wird mit der Blocklänge ausgeübt, die durch die Blocklängen-Entscheidungsschaltung festgelegt wird.
  • Die EP-A 612 158 ist Teil des Standes der Technik nach Artikel 54(3) und (4), EPÜ und ist somit lediglich hinsichtlich der Neuigkeit relevant. Diese offenbart ein Gerät, um ein Digitalsignal zu codieren, welches eine Einrichtung umfaßt, das Digitalsignal in mehrere zeitliche Signale in entsprechende Frequenzbänder zu unterteilen, eine Einrichtung, um eine Transformation bezüglich Blockdaten der zeitlichen Signale durchzuführen, und eine Einrichtung, die auf die zeitlichen Signale anspricht, um die Längen der Blöcke festzulegen.
  • Gemäß der vorliegenden Erfindung wird ein Gerät zum Codieren eines Digitalsignals bereitgestellt, welches umfaßt:
  • eine Einrichtung, um das Digitalsignal in mehrere Zeitsignale zu unterteilen, die entsprechende Frequenzbänder einnehmen,
  • eine Einrichtung, um in jedem Band eine Umformung bezüglich Digitaldatenblöcken durchzuführen, die das Signal im Band darstellen, und
  • eine Einrichtung, die auf das Digitalsignal anspricht, um die Längen der Blöcke zu bestimmen,
  • dadurch gekennzeichnet, daß die Blocklängen-Bestimmungseinrichtung die Länge eines laufenden Blocks in einem Band in Abhängigkeit von den zeitlichen Signalleistungen in diesem Band und in zumindest einem anderen der Bänder bestimmt.
  • Damit kann die Blocklänge in einem Band nicht nur auf der Basis der Signalleistung in diesem einen Band bestimmt werden, sondern es wird auch ein anderes Band (andere Bänder) in Betracht gezogen. Damit kann beispielsweise der Effekt eines Übergangs in einem Band durch ein Signal in einem anderen Band maskiert werden, wodurch eine bessere Auswahl der Blocklänge ermöglicht wird.
  • Bei einer Ausführungsform dieses einen Merkmals haben die Blöcke eine maximale Blocklänge und die Blocklängen-Bestimmungseinrichtung (19, 20, 21) eines jeden Bands bestimmt die laufende Blocklänge in Abhängigkeit von zeitlicher Signalleistungsvariation in dem einen der Bänder über eine Zeitdauer, die größer ist als eine Zeitdauer, die der maximalen Blocklänge entspricht, und
  • in Abhängigkeit von der Signalleistung in dem oder jedem anderen Frequenzband.
  • Damit kann die Blocklänge mit einer besseren Anpassung an ein komplexes Signal festgelegt werden.
  • Eine weitere Ausführungsform umfaßt eine Einrichtung, um einen Wert der Blocklänge zu speichern, die für zumindest einen Block festgelegt wird, der dem laufenden Block vorhergeht, und wobei die Blocklängenbestimmungseinrichtung die Blocklänge in Abhängigkeit von dem oder jedem gespeicherten Wert der Blocklänge festlegt.
  • Dies verbessert die Qualität der Blocklängen-Entscheidungsbildung.
  • Es wird möglich, die periodischen Änderungen oder Merkmale in Betracht zu ziehen, die für eine längere Zeitdauer andauern, als die des Verarbeitungsblocks der laufenden Eingangssignale beim Auswählen der zeitlichen Größe des Verarbeitungsblocks für die laufenden Eingangssignale. Für Audiosignale wird damit eine optimale Tonqualität, die durch die Ohren wahrgenommen wird, erzeugt.
  • Eine Ausführungsform der vorliegenden Erfindung ist für eine optimale Kompatibilität zwischen der hohen Tonqualität, wie sie durch die Ohren aufgenommen wird, und der effizienten Reduktion des Effekts des Vorechos bei der Transformationscodierung effektiv. Diese ist jedoch ähnlich bei irgendeinem anderen hocheffizienten Codierverfahren beim Einrichten einer optimalen Kompatibilität zwischen der Frequenzauflösung und zeitlichen Auflösung effektiv.
  • Bei dem bevorzugten Gerät nach der Erfindung zum Aufzeichnen und/oder Wiedergeben oder zum Übertragen und/oder Empfangen von komprimierten Daten besteht wenig oder keine Gefahr, einen Block einer zeitlichen Länge auszuwählen, die kürzer ist als notwendig, wenn die zeitliche Größe und die Fensterform des orthogonalen Transformationsblocks als Antwort auf die tatsächlichen Amplitudenänderungen der Eingangssignale geändert wird, wodurch eine zufriedenstellendere Tonqualität bei der gleichen Bitrate erreicht werden oder eine niedrigere Bitrate zum Aufzeichnen oder Übertragen für die gleiche Tonqualität angewandt werden kann.
  • Die Erfindung wird nun weiter mittels eines beispielhaften und nichteinschränkenden Ausführungsbeispiels mit Hilfe der beiliegenden Zeichnungen beschrieben, in denen:
  • Fig. 1 eine Blockschaltung ist, die einen typischen Aufbau eines Plattenaufzeichnungs- und/oder Wiedergabegeräts, das ein Aufzeichnungs- und/oder Wiedergabegeräts für komprimierte Daten gemäß der vorliegenden Erfindung verkörpert, zeigt;
  • Fig. 2 eine Blockdarstellung ist, die ein konkretes Beispiel eines hochwirksamen Kompressionscodierers zeigt, der für die Bitraten-Kompressionscodierung durch die in Fig. 1 gezeigte Ausführungsform verwendet werden kann;
  • Fig. 3A, 3B und 3C den Aufbau von orthogonalen Transformationsblöcken für die Bitkompression zeigen;
  • Fig. 4 eine Blockdarstellung ist, die einen typischen Aufbau einer Blockgrößen- Entscheidungsschaltung zeigt, um eine orthogonale Transformationsblockgröße zu entscheiden;
  • Fig. 5a, 5b und 5c die Beziehung zwischen den Änderungen der zeitlichen Länge von zeitlichen aufeinanderfolgenden orthogonalen Transformationsblöcken und einer Fenstergröße zeigen, die für die orthogonale Transformation verwendet werden;
  • Fig. 6 ausführlich eine Fensterform zeigt, die für die orthogonale Transformation verwendet wird;
  • Fig. 7A und 7B den Vorechomaskierungseffekt unter den Funktionen der Blockentscheidungsschaltung zeigt;
  • Fig. 8A und 8B den Effekt zeigen, die Information, die die Änderungen bei Eingangssignalen über mehrere Verarbeitungsblöcke betreffen, auf die Blockentscheidung unter den Funktionen der Blockentscheidungsschaltung zu beziehen;
  • Fig. 9 eine Blockschaltung ist, die einen konkreten Aufbau zeigt, um eine Bitzuteilungs-Arithmetik-Logikfunktion zu realisieren;
  • Fig. 10 eine graphische Darstellung ist, welche Spektralkomponenten für kritische Bänder und Bänder zeigt, die von den kritischen Bändern hilfsunterteilt sind, um das Blockfließen in Betracht zu ziehen;
  • Fig. 11 eine graphische Darstellung ist, die ein Maskierungsspektrum zeigt;
  • Fig. 12 eine graphische Darstellung ist, welche eine Minimalhörbarkeitskurve und das Maskierungsspektrum, welche zusammenkombiniert sind, zeigt; und
  • Fig. 13 eine Blockschaltung ist, die ein konkretes Beispiel eines Decoders in Verbindung mit der hochwirksamen Kompressionscodierung zeigt, die für die Bitraten-Kompressionscodierung bei der in Fig. 1 gezeigten Ausführungsform angewandt werden kann.
  • Eine bevorzugte Ausführungsform der Erfindung wird nun ausführlich mit Hilfe der Zeichnungen beschrieben.
  • Fig. 1 zeigt eine schematische Anordnung (Blockschaltungsdiagramm) eines Aufzeichnungs- und /oder Wiedergabegeräts für komprimierte Daten gemäß einer Ausführungsform der Erfindung.
  • Bei einer magneto-optischen Plattenaufzeichnungs-/Wiedergabeeinheit des Kompressionsdatenaufzeichnungs- und/oder Wiedergabegerät, welches in Fig. 1 gezeigt ist, wird eine magneto-optische Platte 1, die durch einen Spindelmotor 51 gedreht wird, als Aufzeichnungsträger verwendet. Beim Aufzeichnen von Daten auf der magneto-optischen Platte 1 wird ein moduliertes Magnetfelds entsprechend den Aufzeichnungsdaten durch einen Magnetkopf 54 angelegt, während die magneto-optische Platte 1 mit einem Laserlichtstrahl durch den optischen Kopf 53 bestrahlt wird, wobei das Aufzeichnen durch Magnetfeldmodulation für Aufzeichnungsdaten längs einer Aufzeichnungsspur der magneto-optischen Platte 1 durchgeführt wird. Beim Wiedergeben der aufgezeichneten Daten wird die Aufzeichnungsspur auf der magneto-optischen Platte 1 durch einen Laserlichtstrahl nachgeführt, um die Wiedergabe fotomagnetisch auszuführen.
  • Der optische Kopf 53 besteht aus einer Laserlichtquelle, beispielsweise einer Laserdiode, optischen Komponenten, beispielsweise einer Kollimatorlinse, einer Objektivlinse, einem Polarisationslicht-Strahlenteiler oder einer Zylinderlinse, und einem Fotodetektor, der einen Lichtempfangsabschnitt besitzt, der ein vorher-festgelegtes Muster aufweist. Der optische Kopf 53 ist an einer Position angeordnet, die dem Magnetkopf 54 gegenüberliegt, wobei die magneto-optische Platte 1 dazwischen angeordnet ist. Zum Datenaufzeichnen auf der magneto-optischen Platte 1 wird der Magnetkopf 54 durch eine Kopfansteuerschaltung 66 eines Aufzeichnungssystems angesteuert, wie später erläutert wird, um ein moduliertes Magnetfeld entsprechend den Aufzeichnungsdaten an die Platte 1 anzulegen, wobei ein Laserlichtstrahl durch den optischen Kopf 53 auf eine Zielspur der magneto-optischen Platte 1 abgestrahlt wird, um eine thermo-magnetische Aufzeichnung gemäß der Magnetfeldmodulation durchzuführen. Der optische Kopf 53 ermittelt außerdem das reflektierte Laserlicht von der Zielspur, um den Fokussierungsfehler durch ein Astigmatikverfahren zu ermitteln, wobei er den Spurnachführungsfehler durch ein Gegentaktverfahren ermittelt. Wenn Daten von der magneto- optischen Platte 1 reproduziert werden, ermittelt der optische Kopf 53 den Fokussierungsfehler oder den Spurnachführungsfehler, wobei er außerdem die Differenz des Polarisationswinkels (des Kerr-Drehwinkels) des reflektierten Lichts von der Zielspur ermittelt, um die Wiedergabesignale zu erzeugen.
  • Ein Ausgangssignal des optischen Kopfes 53 wird zu einer HF-Schaltung 55 geliefert, welche die oben erwähnten Fokussierungsfehlersignale und die Spurnachführungsfehlersignale von einem Ausgangssignal des optischen Kopfs 53 extrahiert, um die extrahierten Signale zu einer Servosteuerschaltung 56 zu übertragen. Die HF-Schaltung 55 setzt außerdem die Wiedergabesignale in Zweipegel-Signale um, die zu einem Decoder 71 des Wiedergabesystems, welches später erläutert wird, geliefert werden.
  • Die Servosteuerschaltung 56 besteht beispielsweise aus einer Fokussierungsservo- Steuerschaltung, einer Spurnachführungsservo-Steuerschaltung, einer Spindelservo-Steuerschaltung, einer Getriebeservo-Steuerschaltung usw.. Die Fokussierungsservo-Steuerschaltung steuert die Fokussierung des optischen Systems des optischen Kopfs 53, so daß das Fokussierungssignal auf 0 reduziert wird. Die Spurnachführungsservo-Steuerschaltung steuert die Spurnachführung des optischen Systems des optischen Kopfs 53 so, daß das Spurnachführungssignal auf 0 reduziert wird. Die Spindelmotorservo-Steuerschaltung steuert den Spindelmotor 51 so, um die magneto-optische Platte 1 in eine Drehbewegung mit einer vorher-gewählten Drehgeschwindigkeit anzutreiben, beispielsweise mit einer konstanten Lineargeschwindigkeit. Die Getriebeservo-Steuerschaltung verschiebt den optischen Kopf 53 und den Magnetkopf 54 auf eine Zielspurposition der magneto-optischen Platte 1, die durch eine Systemsteuerung 57 bestimmt wird. Die Servosteuerschaltung 56 überträgt die Information, welche die Betriebszustände der verschiedenen Komponenten zeigt, die durch die Servosteuerschaltung 56 gesteuert werden, zur Systemsteuerung 57.
  • Eine Tasteingabeeinheit 58 und eine Anzeige 59 sind mit der Systemsteuerung 57 verbunden, die das Aufzeichnungssystem und das Wiedergabesystem unter der Betriebsart steuert, die durch die Eingabeinformation, die in die Tasteneingabeeinheit 58 eingegeben wird, bestimmt wird. Die Systemsteuerung 57 überwacht außerdem die Aufzeichnungsposition und die Wiedergabeposition auf der Aufzeichnungsspur, die durch den optischen Kopf 53 und den Magnetkopf 54 nachgeführt wird, auf der Basis der Sektorbasis-Adreßinformation, die von der Aufzeichnungsspur der magneto-optischen Platte 1 reproduziert wird, durch Q-Daten, beispielsweise Datenkopfzeitdaten oder Subcodedaten. Außerdem bewirkt die Systemsteuerung 57, daß die Wiedergabezeit auf der Anzeigeeinrichtung 59 auf der Basis des Datenkompressionsverhältnisses in der Bitkompressionsbetriebsart und die Wiedergabepositionsinformation auf der Aufzeichnungsspur angezeigt wird.
  • Zur Anzeige der Wiedergabezeit wird die Sektorbasis-Adreßinformation (Absolutzeitinformation), die von der Aufzeichnungsspur der magneto-optischen Platte 1 durch die Datenkopfzeitdaten oder die Subcode-Q-Daten reproduziert wird, mit einem Kehrwert des Datenkompressionsverhältnisses für die Bitkompressionsbetriebsart multipliziert, beispielsweise mit 4 für das Bitkompressionsverhältnis von 1/4, um die aktuelle Zeitinformation zu finden, die auf der Anzeigeeinrichtung 59 angezeigt wird. Während der Aufzeichnung ist es, wenn die Absolutzeitinformation vorher auf der Aufzeichnungsspur der magneto-optischen Platte 1 aufgezeichnet ist, d. h., wenn die magneto-optische Platte 1 vorformatiert ist, möglich, die laufende Position durch die aktuelle Aufzeichnungszeit anzuzeigen, wobei die vorformatierte Absolutzeitinformation gelesen wird und diese mit einem Kehrwert des Datenkompressionsverhältnisses multipliziert wird.
  • Bei einem Aufzeichnungssystem des vorliegenden Plattenaufzeichnungs- und/oder Wiedergabegeräts werden analoge Audioeingangssignale AIN von einem Eingangsanschluß 60 über ein Tiefpaßfilter (LPF) 61 zu einem A/D-Umsetzer 62 geliefert, der die analogen Audioeingangssignale AIN quantisiert. Die digitalen Audiosignale, die durch den A/D-Umsetzer 62 erzeugt werden, werden zu einem adaptiven transformations-codierenden PCM-Codierer (ATC) 63 geliefert. Dagegen werden die digitalen Audioeingangssignale DiN von einem Eingangsanschluß 67 über eine Eingangsschnittstellenschaltung 68 zum ATC-Codierer 63 geliefert, wo die Bitkompression oder die Datenkompression bezüglich der digitalen Audio-PCM- Daten mit einer vorher-festgelegten Übertragungsgeschwindigkeit durchgeführt wird, die gleich dem Eingangssignal AIN ist, welches durch den A/D-Umsetzer 62 quantisiert wurde. Obwohl die folgende Beschreibung in Verbindung mit der Kompressionsrate von vier angegeben wird, ist die vorliegende Ausführungsform nicht vom speziellen Wert der Kompressionsrate abhängig, die auf gewünschte Werte in Abhängigkeit von den besonderen Anwendungen eingestellt werden kann.
  • Der Speicher 64 ist ein Pufferspeicher, der gemäß dem Datenschreiben und dem Datenlesen durch die Systemsteuerung 57 gesteuert wird, um vorübergehend ATC-Daten zu speichern, die vom ATC-Codierer 63 zum Aufzeichnen auf der Platte geliefert werden, wenn die Notwendigkeit auftritt. Das heißt, daß die komprimierten Audiodaten, die vom ATC-Codierer 63 geliefert werden, eine Datenübertragungsrate haben, die auf ein 1/4 der Datenübertragungsrate für das Standard-CD-DA-Format von 75 Sektor pro Sekunde oder auf 18,75 Sektoren pro Sekunde vermindert ist. Die komprimierten Daten werden fortlaufend in den Speicher 64 geschrieben. Obwohl es ausreicht, die komprimierten Daten (ATC-Daten) mit einer Rate von 1 pro 8 Sektoren aufzuzeichnen, wie oben erwähnt, ist ein derartiges Aufzeichnen in jedem achten Sektor praktisch unmöglich, so daß ein sektor-fortlaufendes Aufzeichnen durchgeführt wird, wie später erläutert wird. Dieses Aufzeichnen wird im burstartig mit der Datenübertragungsrate von 75 Sektoren pro Sekunde ausgeführt, die die gleiche ist wie beim Standard-CD-DA-Format, bei dem ein Cluster aus mehreren vorher-gewählten Sektoren besteht, beispielsweise 32 plus mehreren Sektoren als Aufzeichnungseinheit, wobei eine Nichtaufzeichnungsperiode dazwischen angeordnet ist. Das heißt, daß die Stereo-B-Modus-ATC-Audiodaten, die fortlaufend einer niedrigen Übertragungsrate von 9,375 ( = 75/8) Sektoren pro Sekunde in Verbindung mit der Bitkompressionsbetriebsart in den Speicher 64 geschrieben sind, als Aufzeichnungsdaten burstartig mit der oben erwähnten Übertragungsrate von 75 Sektoren pro Sekunde gelesen werden. Die Gesamtdaten-Übertragungsrate der Daten, die gelesen und aufgezeichnet werden, einschließlich der Nichtaufzeichnungsperiode, ist die niedrige Rate von 18,75 Sektoren pro Sekunde. Die augenblickliche Datenübertragungsrate innerhalb der Zeitperiode des Aufzeichnungsbetriebs, der burstartig durchgeführt wird, ist jedoch die oben erwähnte Standarddaten-Übertragungsrate von 75 Sektoren pro Sekunde. Wenn daher die Plattendrehgeschwindigkeit die gleiche ist wie die beim Standard-CD-DA- Format, die eine konstante Lineargeschwindigkeit ist, wird das Aufzeichnen mit der gleichen Aufzeichnungsdichte und mit dem gleichen Aufzeichnungsmuster wie beim CD-DA-Format durchgeführt.
  • Die ATC-Audiodaten, die von dem Speicher 64 mit der oben erwähnten augenblicklichen Übertragungsrate von 75 Sektoren pro Sekunde, d. h., die Aufzeichnungsdaten, werden zu einem Codierer 65 geliefert. Die Einheit, mit der die Datenfolge, die vom Speicher 64 zum Codierer 65 geliefert wird, für jedes Aufzeichnen aufgezeichnet wird, ist ein Cluster, der aus mehreren Sektoren besteht, beispielsweise 32 Sektoren, und mehreren Cluster-Verknüpfungssektoren, die vor und hinter dem Cluster aufgereiht sind. Die Cluster-Verknüpfungsektoren werden so gewählt, daß diese länger sind als eine Verschachtelungslänge im Codierer 65, so daß die Daten von benachbarten Clustern nicht durch das Datenverschachteln beeinträchtigt werden.
  • Der Codierer 65 führt das Codieren für die Fehlerkorrektur durch, beispielsweise die Paritätsanhängung und die Datenverschachtelung oder die EFM-Codierung bezüglich der Aufzeichnungsdaten, die vom Speicher 64 burstartig geliefert werden. Die durch den Codierer 65 codierten Aufzeichnungsdaten werden zu einer Magnetkopf-Ansteuerschaltung 66 geliefert. Der Magnetkopf 54 ist mit der Magnetkopf-Ansteuerschaltung 66 verbunden, die den Magnetkopf 54 ansteuert, um ein moduliertes Magnetfeld entsprechend den Aufzeichnungsdaten an die magneto-optische Platte 1 anzulegen.
  • Die Systemsteuerung 57, die den Speicher 64 wie oben beschrieben steuert, steuert außerdem die Aufzeichnungsposition in einer Weise, daß die Aufzeichnungsdaten, die burstartig durch die Speichersteuerung gelesen werden, fortlaufend auf der Aufzeichnungsspur der magneto-optischen Platte 1 aufgezeichnet werden. Die Aufzeichnungsposition wird durch Überwachen der Aufzeichnungsposition der aufgezeichneten Daten, die burstartig durch die Systemsteuerung 57 aus dem Speicher 54 gelesen werden, gesteuert, sowie durch Liefern eines Steuersignals, welches die Aufzeichnungsposition auf der Aufzeichnungsspur der magneto-optischen Platte 1 bestimmt, zur Servosteuerschaltung 56..
  • Das Wiedergabesystem der Aufzeichnungs-/Wiedergabeeinheit für die magneto- optische Platte 1 wird anschließend erläutert.
  • Das Wiedergabesystem wird zum Reproduzieren der Aufzeichnungsdaten verwendet, die fortlaufend auf der Aufzeichnungsspur der magneto-optischen Platte 1 aufgezeichnet sind, und umfaßt einen Decoder 71, zu dem ein Wiedergabeausgangssignal, welches beim Abtasten der Aufzeichnungsspur der magneto-optischen Platte 1 mit einem Laserlichtstrahl vom optischen Kopf 53 erzeugt wird, nach Umwandlung im Zweipegel-Daten durch die HF- Schaltung 55 geliefert wird. Die Aufzeichnungsdaten können nicht nur von magneto-optischen Platte 1 gelesen werden, sondern auch von der optischen Nur-Wiedergabeplatte der gleichen Art beispielsweise der sogenannten Compact Disc.
  • Der Decoder 71 ist ein Gegenstück des Codierers 65 des oben beschrieben Aufzeichnungssystems und führt das oben erwähnte Decodieren für die Fehlerkorrektur oder das EFM-Decodieren bezüglich des Zweipegel-Wiedergabeausgangssignals der HF-Schaltung 55 durch, während er die ATC-Audiodaten mit einer Übertragungsrate von 75 Sektoren pro Sekunde reproduziert, die schneller ist als die normale Übertragungsrate. Die durch den Decoder 71 erhaltenen Wiedergabedaten werden zu einem Speicher 72 geliefert.
  • Das Datenschreiben und das Datenlesen im Speicher 72 wird durch die Systemsteuerung 57 in einer Weise gesteuert, daß die Wiedergabedaten, die vom Decoder 71 mit der Übertragungsrate von 75 Sektoren pro Sekunde geliefert werden, in diesen burstartig mit der Übertragungsrate von 75 Sektoren pro Sekunde geschrieben werden. Dagegen werden die Wiedergabedaten, die burstartig mit der Übertragungsrate von 75 Sektoren pro Sekunde in den Speicher 72 geschrieben werden, fortlaufend aus dem Speicher 72 mit der normalen Übertragungsrate von 18,75 Sektoren pro Sekunde gelesen.
  • Die Systemsteuerung 57 steuert den Speicher 52 in einer Weise, um die Wiedergabedaten in den Speicher 72 mit der Übertragungsrate von 75 Sektoren pro Sekunde zu schreiben und um die Wiedergabedaten von dem Speicher 72 mit der oben erwähnten Übertragungsrate von 18,75 Sektoren pro Sekunde fortlaufend zu lesen. Die Systemsteuerung 57, die den Speicher 72 wie oben beschrieben steuert, steuert die Wiedergabeposition in einer Weise, daß die Wiedergabedaten, die burstartig von dem Speicher 72 unter der Steuerung durch die Systemsteuerung 57 geschrieben sind, fortlaufend von der Aufzeichnungsspur der magneto- optischen Platte reproduziert werden. Die Wiedergabeposition wird in einer Weise gesteuert, daß die Wiedergabeposition der Wiedergabedaten, die burstartig von dem Speicher 72 gelesen werden, durch die Systemsteuerung 57 überwacht werden, und ein Steuersignal, welches die Wiedergabeposition auf der Aufzeichnungsspur der magneto-optischen Platte 1 oder der optischen Platte bestimmt, zur Servosteuerschaltung 56 übertragen wird.
  • Die ATC-Audiodaten, die als Wiedergabedaten erhalten werden, die fortlaufend von dem Speicher 72 mit der Übertragungsrate von 18,75 Sektoren pro Sekunde gelesen werden, werden zu einem ATC-Decoder 73 geliefert. Der ATC-Decoder 73 expandiert die ATC- Daten um einen Faktor acht mittels einer Bitexpansion, um 16-Bit-Digitalaudiodaten zu reproduzieren. Die digitalen Audiodaten vom ATC-Decoder 73 werden zu einem D/A-Umsetzer 74 geliefert.
  • Der D/A-Umsetzer 74 setzt die digitalen Audiodaten, die vom ATC-Decoder 73 geliefert werden, in Analogsignale um, um analoge Audioausgangssignale AOUT zu bilden. Die analogen Audioausgangssignale AOUT werden über ein Tiefpaßfilter 75 an einem Ausgangsanschluß 76 ausgegeben.
  • Die hochwirksame Kompression und das hochwirksame Codieren werden ausführlich erläutert.
  • Das heißt, das Verfahren zum Durchführen des hochwirksamen Codierens bezüglich digitaler Eingangssignale, beispielsweise PCM-Audiosignale durch Subband-Codieren (SBC), adaptives Transformationscodieren (ATC) und adaptiver Bitzuteilung wird unter Bezug auf Fig. 2 ff erläutert.
  • Bei der konkreten hochwirksamen Codiereinrichtung, die in Fig. 2 gezeigt ist, wird der Frequenzbereich der digitalen Eingangssignale in mehrere Frequenzbänder unterteilt, so daß zwei benachbarte unterste Bänder eine gleiche Bandbreite haben, und die Bandbreite progressiv breiter in der Richtung ansteigender Frequenzen wird. Die digitalen Eingangssignale werden orthogonal von einem Frequenzband zum anderen transformiert, um Frequenzbereichs-Spektraldaten zu erzeugen, die mit der Anzahl von Bits codiert sind, die adaptiv auf der Basis von sogenannten kritischen Bändern für den unteren Frequenzbereich zugeteilt werden, um die Charakteristik des menschlichen Hörsinnes in Betracht zu ziehen, wie später erläutert wird, und auf der Basis von schmäleren Bändern, die von den kritischen Bändern für den höheren Frequenzbereich hilfsunterteilt sind, um die Blockfließwirksamkeit zu steigern. Dieser Block wird üblicherweise zum Block, der dem Quantisierungsrauschen unterworfen ist, d. h., zu dem Block auf der Basis, von dem das Quantisierungsrauschen erzeugt wird. Bei der vorliegenden Ausführungsform wird nebenbei bemerkt die Blockgröße oder die Blocklänge adaptiv vor der orthogonalen Transformation in Abhängigkeit von Eingangssignalen geändert, und das Fließen wird auf Blockbasis durchgeführt.
  • Gemäß Fig. 2 werden PCM-Audiosignale, die einen Frequenzbereich von 0 bis 22 kHz haben, wobei die Abtastfrequenz 44,1 kHz beträgt, zu einem Eingangsanschluß 10 geliefert. Diese Eingangssignale werden durch ein Frequenzteilungsfilter 11 beispielsweise durch ein QMF-Filter (Quadratur-Spiegelfilter) in Signale unterteilt, die einen Frequenzbereich von 0 bis 11 kHz haben und einen Frequenzbereich von 11 bis 22 kHz haben. Die Signale, die den Frequenzbereich von 0 bis 11 kHz haben, werden ähnlich durch ein ähnliches Frequenzteilungsfilter 12, beispielsweise ein QMF-Filter, in Signale unterteilt, die ein Frequenzband von 0 bis 5,5 kHz haben, und in Signale, die ein Frequenzband von 5,5 kHz bis 11 kHz haben. Die Signale im Bereich von 11 bis 22 khz vom Frequenzteilungsfilter 11 werden zu einer MDCT- Schaltung 13, die eine Art der Orthogonaltransformationsschaltung ist, zur MDCT-Verarbeitung übertragen. Ähnlich werden die Signale im Bereich von 5,5 bis 11 kHz vom Frequenzteilungsfilter 12 zu einer MDCT-Schaltung 14 übertragen, während die Signale im Bereich von 0 bis 5,5 kHz vom Frequenzteilungsiilter 12 zur MDCT-Schaltung 15 zur MDCT-Verarbeitung übertragen werden.
  • Unter den Verfahren, um die oben erwähnten digitalen Eingangssignale in mehrere Frequenzbänder zu unterteilen, existiert ein QMF-Filter, welches beispielsweise im Jahr 1976 von R.E. Crochiere, mit dem Titel "Digital Coding of Speech in Sub-bands", Beil Syst. Tech. J. Vol. 55, Nr. 8, 1976 erläutert wird. Das Filterunterteilungsverfahren in gleiche Bandbreiten ist in ICASSP 83, Boston, "Polyphase Quadrature Filters -A New Sub-Band Coding Technique", Joseph H. Rothweiler, erläutert.
  • Als Beispiele der oben beschriebenen orthogonalen Transformation gibt es eine orthogonale Transformation, bei der Eingangsaudiosignale in Zeitblöcke einer vorher-festgelegten Länge (Rahmen) unterteilt werden und mit der schnellen Fourier-Transformation (FFT), mit der diskreten Kosinustransformation (DCT) oder der modifizierten DCT (MDCT) unterteilt sind, um Zeitbereichssignale in Frequenzbereichssignale zu transformieren. Besprechungen über MDCT können gefunden werden in ICASSP 1987 "Sub-band/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation, "J.P. Princen, A.B. Bradley, Univ. of Surrey, Royal Melbourne Inst. of. Tech..
  • Fig. 3 zeigt konkrete Beispiele von Standardeingangssignalen in Blöcken auf Bandbasis, die zu den MDCT-Schaltungen 13 bis 15 geliefert werden.
  • Bei dem konkreten Beispiel von Fig. 3 hat jedes von drei Filterausgangssignalen mehrere orthogonale Blockgrößen unabhängig in jedem Band und kann zur zeitlichen Auflösung in Abhängigkeit von beispielsweise zeitlichen Charakteristiken oder der Frequenzverteilung der Filterausgangssignale umgeschaltet werden. Wenn die Signale zeitlich pseudostationär sind, wird die orthogonale Transformationsblockgröße auf einen größeren Wert von 11,6 ms festgelegt, d. h., auf einen langen Modus (Langmodus), der in Fig. 3A gezeigt ist, während, wenn die Signale nicht-stationär sind, wird die orthogonale Blockgröße weiter durch Faktoren von 2 oder 4 unterteilt. Durch das weitere Unterteilen der Blockgröße in vier Teile (Kurzmodus), wobei jedes Teil 2,9 ms beträgt, wie in Fig. 3B gezeigt ist, oder durch Unterteilen der Blockgröße in 2 Teile, wobei das Teil 5,8 ms beträgt, und in 4 Teile, wobei jedes Teil 2,9 ms ist (mittlerer Modus), wie in Fig. 3C und 3D gezeigt ist, können komplexe Eingangssignale, die tatsächlich angetroffen werden, ziemlich zufriedenstellend untergebracht werden. Eine weitere komplexe Unterteilung der orthogonalen Blockgröße ist offensichtlich effektiver insoweit, wie dies der Verarbeitungseinrichtungsumfang erlaubt. Die Blockgrößenentscheidung wird in den Blockgrößen-Entscheidungsschaltungen 19, 20 und 21 getroffen und zu den MDCT-Schaltungen 13, 14 und 15 übertragen, wobei diese an Ausgangsanschlüssen 28, 29 und 30 als Blockgrößeninformation der entsprechenden Blöcke ausgegeben wird.
  • Die Blockgrößen-Entscheidungsschaltungen sind ausführlich in Fig. 4 gezeigt. Die in Fig. 2 gezeigte Blockentscheidungsschaltung wird als Beispiel herangezogen. Von den Ausgangssignalen des Frequenzteilungsfilters 11, welches in Fig. 2 gezeigt ist, wird das Ausgangssignal im Bereich von 11 bis 22 kHz über einen Eingangsanschluß 301 in Fig. 4 zu einer Leistungsberechnungsschaltung 304 geliefert, während das Ausgangssignal im Bereich von 5,5 bis 11 kHz über einen Eingangsanschluß 302 in Fig. 4 zu einer Leistungsberechnungsschaltung 305 geliefert und das Ausgangssignal im Bereich von 0 bis 5,5 kHz über einen Eingangsanschluß 303 in Fig. 4 zu einer Leistungsberechnungsschaltung 306 geliefert wird.
  • Die Blockgrößen-Entscheidungsschaltungen 20, 21 sind im Betrieb gleich wie die Blockgrößen-Entscheidungsschaltung 19, mit der Ausnahme, daß die Signale, die an den Eingangsanschlüssen 301 bis 303 eingegeben werden, gegenüber denjenigen der Entscheidungsschaltung 19 verschieden sind. Die Eingangsanschlüsse 301 bis 303 in jeder der Blockgrößen- Entscheidungsschaltungen 19 bis 21 haben einen Matrixaufbau in dem Sinn, daß der 5,5 kHz -11 kHz -Ausgangsanschluß der 0 kHz - 5,5 kHz-Ausgangsanschluß mit den Eingangsanschlüssen 301 und 302 der Blockgrößen-Entscheidungsschaltung 20 verbunden sind. Das gleiche gilt für die Blockgrößen-Entscheidungsschaltung 21.
  • In Fig. 4 finden die Leistungsberechnungsschaltungen 304, 305 und 306 die Leistungen in den jeweiligen Bändern durch Integration der zeitlichen Eingangsschwingungsformen über eine vorher-festgelegte Zeitdauer. Die Integrationszeitdauer muß kürzer als der minimale Zeitblock der oben erwähnten Blockgrößen sein. Außer dem obigen Berechnungsverfahren kann der Absolutwert der maximalen Amplitude oder der Mittelwert der Amplituden in einer minimalen Zeitbreite der orthogonalen Blockgrößen ebenfalls als repräsentativer Leistungswert verwendet werden. Ein Ausgangssignal der Leistungsberechnungsschaltung 304 wird zu einer Abweichungsextraktionsschaltung 308 und einer Leistungskomparatorschaltung 309 geliefert, während die Ausgangssignale der Leistungsberechnungsschaltungen 305, 306 zu einer Leistungskomparatorschaltung 309 geliefert werden.
  • Die Abweichungsextraktionsschaltung 308 findet den Differenzkoeffizienten der Leistung heraus, die von der Leistungsberechnungsschaltung 304 geliefert wird, um den somit gefundenen Koeffizienten zur Primärblockgrößen-Entscheidungsschaltung 310 und zum Speicher 307 als Abweichungslistungsinformation zu liefern. Der Speicher 307 speichert die Leistungsabweichungsinformation, die von der Extraktionsschaltung 308 geliefert wird, für eine Zeitdauer, die länger ist als die maximale Zeitdauer der oben erwähnten orthogonalen Transformationsblockgrößen, da die zeitlich aufeinanderfolgenden orthogonalen Transformationsblöcke einander aufgrund des Fensterbetriebs während der orthogonalen Transformation beeinträchtigen und daher die Leistungsabweichungsinformation des unmittelbar zeitlich vorhergehenden Blocks durch die Primärblockgrößen-Entscheidungsschaltung 310 erforderlich ist. Auf der Basis der Leistungsabweichungsinformation des betreffenden Blocks, die von der Abweichungsextraktionsschaltung 308 geliefert wird, und der Leistungsvariationsinformation für den unmittelbar vorhergehenden Block vom Speicher 307 findet die Primärblockgrößen- Entscheidungsschaltung 310 die orthogonale Transformationsblockgröße für das relevante Frequenzband von der zeitlichen Variation der Leistung innerhalb des relevanten Frequenzbandes. Wenn die Variation, die einen vorher-festgelegten Wert übermäßig übersteigt, erzeugt wird, wird die orthogonale Transformationsblockgröße einer kürzeren Zeitdauer ausgewählt. Ähnliche Effekte können auch erzeugt werden, wenn der Variationspunkt fest bleibt. Günstigere Effekte könnten dadurch erhalten werden, daß die Blockgröße so festgelegt wird, daß sie proportional zur Frequenz ist, in einer Weise, daß die Blockgröße eine kürzere Zeitdauer beträgt mit einer längeren Variation für eine höhere Frequenz, und eine kürzere Zeitdauer mit einer kleineren Variation für eine untere Frequenz. Obwohl ein fließender Übergang wünschenswert ist, können auch mehrere stufenförmige Änderungen toleriert werden. Die Blockgrößen, die wie oben beschrieben festgelegt werden, werden zu einer Blockgrößen-Korrekturschaltung 311 übertragen.
  • Die Leistungskomparatorschaltung 309 vergleicht die Bandbasis-Leistungsdaten von den Leistungsberechnungsschaltungen 304 bis 306 beide gleichzeitig und für eine Zeitdauer, während der Maskierungseffekt auf der Zeitachse erscheint, um den Effekt bezüglich des Ausgangsbandes der Leistungsberechnungsschaltung durch die anderen Bänder zu finden, um den Effekt zur Blockgrößenberechnungsschaltung 311 zu übertragen.
  • Auf der Basis der Maskierungsinformation, die von der Leistungskomparatorschaltung 309 geliefert wird, und der vergangenen Blockgrößeninformation, die von den Gruppenanschlüssen der Verzögerungseinheiten 312 bis 314 geliefert wird, korngiert die Blockgrößen-Korrekturschaltung 311 die Blockgröße, so daß eine Blockgröße, die länger als die Blockgröße ist, die von der Primärblockgrößen-Entscheidungsschaltung 310 geliefert wird, ausgewählt wird und überträgt die ausgewählte Blockgröße zu den Verzögerungseinheiten 312 und zu einer Fensterform-Entscheidungsschaltung 317. Der Betrieb durch die Blockgrößen-Korrekturschaltung 311 basiert auf der Tatsache, daß, wenn ein beanstandbares Vorecho in einem vorgegebenen Frequenzband erzeugt wird, jedoch ein Signal mit einer größeren Amplitude in anderen Frequenzbändern existiert, vor allem in einem Frequenzband, welches eine niedrigere Frequenz als ein vorher-festgelegtes Frequenzband hat, das Vorecho durch den Maskierungseffekt nicht wahrnehmbar werden kann oder weniger beanstandbar ist.
  • Das Maskieren bedeutet das Phänomen, bei dem bestimmte Signale durch andere Signale maskiert werden und aufgrund von Kennlinien des menschlichen Hörsinnes nicht hörbar werden. Der Maskierungseffekt kann in den Zeitbereichs-Maskierungseffekt klassifiziert werden, der durch Zeitbereichs-Audiosignale erzeugt wird, und den gleichzeitigen Maskierungseffekt, der durch die Frequenzbereichssignale erzeugt wird. Durch dieses Maskieren wird jegliches Rauschen, welches in einem maskierten Bereich vorhanden ist, nicht hörbar. Bei tatsächlichen Audiosignalen ist das Rauschen innerhalb des maskierten Bereichs ein zulässiges Rauschen.
  • Die Gruppen der Verzögerungseinheiten 312 bis 314 speichern die vergangenen orthogonalen Transformationsblockgrößen nacheinander und geben die gespeicherten Blockgrößenwerte an die Blockgrößen-Entscheidungsschaltung 311 aus. Gleichzeitig damit werden die Ausgangssignale der Verzögerungseinheit 312 mit einem Ausgangsanschluß 315 gekoppelt, während die Ausgänge der Verzögerungseinheiten 312, 313 mit der Fensterform-Entscheidungsschaltung 317 gekoppelt werden. Die Ausgänge der Verzögerungseinheiten 312 bis 314 spielen die Rolle, um zu ermöglichen, daß die Blockgrößenänderung einer längeren Zeitdauer in der Blockgrößen-Korrekturschaltung 311 beim Entscheiden der Blockgröße verwendet werden. Wenn die Blockgrößen von kürzeren Zeitdauern häufig in der Vergangenheit ausgewählt werden, wird es ermöglicht, daß die Blockgrößen einer kürzeren Zeitdauer ausgewählt werden, während, wenn die Blockgrößen einer kürzeren Zeitdauer in der Vergangenheit nicht ausgewählt werden, wird es ermöglicht, daß die Blockgrößen einer längeren Zeitdauer ausgewählt werden. Mit Ausnahme für die Verzögerungseinheiten 312, 313, die mit der Fensterentscheidungsschaltung 317 und dem Ausgangsanschluß 315 verknüpft sind, kann die Anzahl von Anzapfungen der Verzögerungseinheiten hin und wieder in Abhängigkeit vom Aufbau und Aufwand der tatsächlichen Einrichtung vergrößert oder verkleinert werden.
  • Die Fensterform-Entscheidungsschaltung 317 wählt vom Ausgangssignal der Blockgrößen-Korrekturschaltung 317, d. h., von der Blockgröße des Blocks, welcher zeitlich unmittelbar dem relevanten Block folgt, das Ausgangssignal der Verzögerungseinheit 312, d. h., die Blockgröße des betreffenden Blocks und das Ausgangssignal der Verzögerungseinheit 313, d. h., die Blockgröße des Blocks, der zeitlich unmittelbar dem relevanten Block vorhergeht, die Form des Fensters, die bei den MDCT-Schaltungen 13 bis 15, die in Fig. 2 gezeigt sind, verwendet werden, aus, und gibt die damit ausgewählte Fensterform an einen Ausgangsanschluß 319 aus. Die Blockgrößeninformation am Ausgangsanschluß 315 und die Fensterforminformation am Ausgangsanschluß 319 werden zu verschiedenen Komponenten der Einrichtung als Ausgangssignale der Blockgrößen-Entscheidungsschaltungen 19 bis 21 geliefert.
  • Die Form des durch die Fensterform-Entscheidungsschaltung 317 ausgewählten Fensters wird anschließend erläutert.
  • Fig. 5a bis 5c zeigen die Fensterformen in Verbindung mit benachbarten Blöcken. Die für die orthogonale Transformation verwendeten Fenster haben Bereiche, die einander zwischen zeitlich benachbarten Blöcken überlappen, wie durch durchgezogenen und unterbrochene Linien in Fig. 5 angedeutet ist. Da die Überlappungsformen bis zur Mitte der benachbarten Blöcke bei der vorliegenden Ausführungsform verwendet werden, wird die Fensterform in Abhängigkeit von den orthogonalen Transformationsgrößen der zeitlich benachbarten Blöcke geändert.
  • Fig. 6 zeigt Einzelheiten der Fensterform. In Fig. 6 sind Fensterfunktionen f(n) und g (n + N) als Funktionen angegeben, die die folgenden Gleichungen (i) erfüllen:
  • f(n) · f(L - 1 - n) = g(n) · g(L - 1 - n)
  • f(n) · f(n) + g(n) · g(n) = 1 (1)
  • Bei der obigen Gleichung (1) zeigt L unmittelbar die Transformationsblocklänge, wenn benachbarte Transformationsblocklängen gleich bleiben. Wenn die benachbarten Transformationsblocklängen sich unterscheiden, gilt unter der Annahme, daß ein kürzerer Block des Transformationsblocks L und eine längere Transformationsblocklänge K ist, die folgende Gleichung (2):
  • f(n) = g(n) = 1... K ≤ n ≤ 3K/2 - L/2
  • f(n) = g(n) = 0... 3K/2+L ≤ n ≤ 2K (2)
  • Damit wird es durch Auswählen der Fensterüberlappungslänge, wenn sie eine längere Länge sein soll, möglich, die Frequenzauflösung des Spektrums während der orthogonalen Transformation zu verbessern.
  • Aus den obigen Ausführungsformen kann man ersehen, daß die Form des Fensters, die für die orthogonale Transformation verwendet wird, bestimmt wird, nachdem die orthogonalen Transformationsgrößen von drei zeitlich aufeinanderfolgenden Blöcken festgelegt sind. Somit wird eine Differenz entsprechend einem Block zwischen dem Block der Signale, die an den Eingangsanschlüssen 301, 302 und 303 in Fig. 4 eingegeben werden, und dem Block der Signale, die an den Ausgangsanschlüssen 315, 319 ausgegeben werden, erzeugt.
  • Mit Hilfe von Fig. 7 und 8 wird der Betrieb der oben erwähnten Blockgrößen-Entscheidungsschaltung 310 erläutert.
  • In Fig. 7 sei aus Einfachheitsgründen angenommen, daß das Eingangssignal für jedes Band eine einzelne gelieferte Sinuswelle ist und daß die gleichen Eingangssignale für das Band von 11 bis 22 kHz für Fig. 7A und 7B geliefert werden. Wenn die zeitliche Größe des orthogonalen Transformationsblocks für einen Block N auf der Basis lediglich von Amplitudenänderungen für das obere Band bestimmt wird, wird die gleiche Blockgröße für Fig. 7A und 7B gesetzt.
  • Wenn jedoch die Aufmerksamkeit auf die Eingangssignale für die Frequenzbereiche von 0 bis 5,5 kHz oder 5,5 kHz bis 11 kHz gerichtet ist, sind die Energie oder Leistungswerte der Bänder außer dem Band von 11 kHz bis 22 kHz niedriger als diejenigen des Frequenzbandes von 11 bis 22 kHz, so daß das Vorecho, welches im Band von 11 kHz bis 22 kHz erzeugt wird, nicht maskiert ist und daher Schwierigkeiten in Verbindung mit dem Hörsinn auftreten. Folglich muß der Block N des Bands von 11 kHz bis 22 kHz in Fig. 7A so ausgewählt werden, daß dieser ein Block ist, der eine kürzere Zeitdauer hat.
  • Dagegen sind in Fig. 7B die Energie- oder Leistungswerte der Bänder von 0 bis 5,5 kHz und von 5,5 bis 11 kHz groß genug, das Vorecho zu maskieren, im Vergleich zu denjenigen des Bandes von 11 bis 22 kHz, so daß das Vorecho, welches im Band von 11 bis 22 kHz erzeugt wird, ohne auftretende Schwierigkeiten in Verbindung mit dem Hörsinn maskiert wird. Daher ist es für Fig. 7B wünschenswert, mehr Emphasis bezüglich der Frequenzauflösung zu plazieren und eine orthogonale Transformationsblockgröße auszuwählen, die größer ist als die im Fall von Fig. 7A.
  • Bei der vorliegenden Ausführungsform wird es durch den Betrieb der Leistungsberechnungsschaltungen 305, 306, der Leistungskomparatorschaltung 309 und der Blockgrößen- Korrekturschaltung 311 möglich, die Blockgröße für den Fall von Fig. 7A so festzulegen, daß diese von der für den Fall von Fig. 7B verschieden ist.
  • Fig. 8A und 8B zeigen ein Signal, welches signifikante Amplitudenänderungen periodisch durchmacht, bzw. ein Signal, welches eine einzige signifikante Amplitudenänderung durchmacht.
  • Für beide Signale werden die gleichen Eingangssignale zwischen zeitlich benachbarten Blöcken (N - 1) und (N + 1) eingegeben. Wenn die zeitliche Größe des orthogonalen Transformationsblocks mit einem Auge festgelegt wird, welches lediglich auf die Blöcke von (N - 1) bis (N + 1) gerichtet ist, ist die Blocklänge für den Block N die gleiche für sowohl Fig. 8A als auch Fig. 8B.
  • Bei dem in Fig. 8A gezeigten Signal werden jedoch die Amplitudenänderungen ähnlich denjenigen für Block N vor dem Block N in einer Weise erzeugt, die die laufenden Eingangssignale charakterisieren. Folglich besteht die Gefahr von Änderungen in der Tonqualität, die in Verbindung mit dem Hörsinn erzeugt wird, wenn die orthogonale Transformationsblockgröße in einer Weise gewählt wird, bei der die Amplitudenänderungen in den Blöcken, die zeitlich dem Block N vorhergehen, nicht beachtet wird.
  • Umgekehrt ist bei dem in Fig. 8B gezeigten Signal die Amplitudenänderung im Block eine einzige Änderung, während analoge Amplitudenänderungen zeitlich stromaufwärts des Blocks N nicht erzeugt werden, so daß Hindernisse bezüglich des Hörsinnes nicht mit Wahrscheinlichkeit erzeugt werden, wenn die Blockgröße für den Block L mit einem Auge ausgewählt wird, welches unmittelbar auf benachbarte Blöcke gerichtet ist.
  • Bei der vorliegenden Ausführungsform wird eine Fehlentscheidung der orthogonalen Transformationsblockgröße, die durch analoge Signale verursacht wird, durch die Gruppen von Verzögerungseinheiten 312 bis 314 und der Blockgrößen-Korrekturschaltung 311 von Fig. 3 verhindert.
  • Bei der vorliegenden Ausführungsform wurde die Bandteilung angewandt, bevor die orthogonale Transformation unmittelbar angewandt wird, um den Maskierungsstatus durch das Vorecho in Betracht zu ziehen. Es können jedoch zufriedenstellendere Ergebnisse dadurch erhalten werden, daß Berechnungen für das Maskieren durchgeführt werden, wobei die unabhängige orthogonale Transformation verwendet wird oder der Frequenzbereich in eine größere Anzahl von Bändern unterteilt wird. Nebenbei bemerkt können periodische zeitliche Änderungen bei den Eingangsignalen für eine längere Zeitdauer bei der obigen Ausführungsform dadurch realisiert werden, daß die orthogonalen Transformationsblockgrößen von vergangenen Blöcken durch Verzögerungseinheiten 312 bis 314 gespeichert werden. Es ist jedoch möglich, zufriedenstellendere Ergebnisse dadurch zu erreichen, daß Daten, die mit der orthogonalen Transformation verarbeitet werden, die sich von der unterscheidet, die während der Kompressionsverarbeitung verwendet wird, oder Daten, die in kleinere Frequenzbänder unterteilt sind, verwendet werden.
  • Kehrt man zur Fig. 2 zurück so werden Niedrigfrequenzkomponenten der Frequenzbereichs-Spektraldaten oder MDCT-Koeffizientendaten, die bei der MDCT-Verarbeitung durch MDCT-Schaltungen 13 bis 15 erhalten werden, für jedes der kritischen Bänder gruppiert, während mittlere bis hohe Frequenzkomponenten von den kritischen Bändern in Erwägung der Blockgleiteffektivität hilfsunterteilt werden und zu adaptiven Bitzuteilungs- Codierschaltungen 22, 23 und 24 und zur Bitzuteilungs-Berechnungsschaltung 18 geliefert werden. Die kritischen Bänder bedeuten die Frequenzbänder, die im gesamten hörbaren Frequenzbereich unterteilt sind, um die Charakteristik des menschlichen Hörsinnes in Betracht zu ziehen, und bezeichnen die Bänder, die dem Schmalbandrauschen eigen sind, das einen reinen Ton der gleichen Intensität wie das Rauschen maskiert und die Frequenz in der Nähe des Rauschens hat. Bei den kritischen Bändern werden die Bandbreiten in Richtung auf die höheren Frequenzen breiter, wobei der gesamte hörbare Frequenzbereich in 25 kritische Bänder unterteilt ist.
  • Die Bitzuteilungs-Berechnungsschaltung 18 berechnet im Hinblick auf den Maskierungseffekt die Maskierungsmengen für jedes kritische Band und jedes Band, welches vom kritischen Band geteilt ist, um das Blockfließen auf der Basis der unterteilten Spektraldaten in Betracht zu ziehen, um die oben erwähnten kritischen Bänder und das Blockgleiten in Betracht zu ziehen. Darüber hinaus berechnet die Bitzuteilungs-Berechnungsschaltung 18 die Anzahl von zugeteilten Bits für die entsprechenden Bänder auf der Basis der Energien oder der Spitzenwerte für jedes der kritischen Bänder und der Bänder, die von den kritischen Bändern geteilt sind, um das Blockfließen in Betracht zu ziehen, und der Maskierungslängen und überträgt die resultierende Information zu den adaptiven Bitzuteilungs- und Codierschaltungen 22, 23 und 24. Die adaptiven Bitzuteilungs- und Codierschaltungen 22 bis 24 quantisieren die Spektraldaten oder die MDCT-Koeffizientendaten in Abhängigkeit von der Anzahl von Bits, die den jeweiligen Bändern in den adaptiven Bitzuteilungs- und Codierschaltungen 22 bis 24 zugeteilt werden. Die auf diese Weise codierten Daten werden an Ausgangsanschlüssen 25 bis 27 ausgegeben.
  • Fig. 9 zeigt in einem schematischen Blockschaltungsdiagramm eine Anordnung einer konkreten Ausführungsform der Bitzuteilungs-Berechnungsschaltung 18, bei der die Frequenzbereichs-Spektraldaten von den MDCT-Schaltungen 13 bis 15 zu einem Eingangsanschluß 701 geliefert werden.
  • Die gelieferten Frequenzbereichsdaten werden zu einer Bandbasis-Energieberechnungsschaltung 702 übertragen, in welcher die Energien der kritischen Bänder und der Bänder, die von den kritischen Bändern unterteilt sind, um das Blockfließen und die Maskierungsmengen in Betracht zu ziehen, durch Berechnen der Gesamtsumme der Amplituden in den entsprechenden Bändern gefunden werden. Die Amplitudenspitzenwerte oder die Mittelwerte können ebenfalls anstelle der Energien in den jeweiligen Bändern verwendet werden.
  • Jede Spektralkomponente, die den Summenwert der Amplituden jeder der jeweiligen Bänder zeigt, ist als SB in Fig. 10 als Ausgangsignal der Energieberechnungsschaltung 702 angedeutet. In Fig. 10 sind 12 Bänder B1 bis B12 gezeigt, die die kritischen Bänder zeigen und die Bänder, die von den kritischen Bändern hilfsunterteilt sind, um das Blockgleiten in Betracht und die Maskierungsmengen in Betracht zu ziehen, um die Zeichnung zu vereinfachen.
  • Es sei angemerkt, daß ein Betrieb zum Multiplizieren jeder Spektralkomponente SB mit einer vorher-festgelegten Wichtungsfunktion, um die Maskierungseffekte in Betracht zu ziehen, nun mittels Faltung durchgeführt wird. Zu diesem Zweck wird ein Ausgangssignal der Bandbasis-Energieberechnungsschaltung 702, d. h., jeder Wert der Spektralkomponente SB zu einer Faltungsfilterschaltung 703 übertragen wird. Die Faltungsfilterschaltung 703 besteht aus mehreren Verzögerungselementen, um nacheinander Eingangsdaten zu verzögern, mehreren Multiplizierern, beispielsweise 25 Multiplizierern, die mit den jeweiligen Bändern in Zusammenhang stehen, um Ausgangssignale der Verzögerungselemente mit Filterkoeffizienten oder Wichtungsfunktionen zu multiplizieren, und einem Addierer, um die Summe der Ausgangssignale der jeweiligen Multiplizierer herauszufinden. Durch derartiges Falten wird die Summe der Bereiche, die durch unterbrochene Linien in Fig. 10 angedeutet sind, herausgefunden.
  • Mittels eines konkreten Beispiels von Multiplikationskoeffizienten oder Filterkoeffizienten der jeweiligen Filter der Faltungsfilterschaltung 703, werden, wenn der Koeffizient eines Multiplizierers M für ein beliebiges Band gleich 1 ist, Ausgangssignale der Verzögerungselemente mit Koeffizienten 0,15, 0,0019, 0,0000086, 0,04, 0,06 und 0,007 in den Multiplizierern M-1, M-2, M-3, M+1, M+2 und M+3 multipliziert, wobei M eine beliebige ganze Zahl von 1 bis 25 ist, um die Faltung der Spektralkomponenten SB durchzuführen.
  • Ein Ausgangssignal der Faltungsfilterschaltung 703 wird zu einem Subtrahierer 704 übertragen, um einen Pegel a herauszufinden, der dem zulässigen Rauschpegel im Faltungsbereich entspricht. Der zulässige Rauschpegel a ist ein Pegel, der einen zulässigen Rauschpegel für jedes der kritischen Bänder durch Entfaltung angeben wird, wie anschließend beschrieben wird. Der Subtrahierer 704 wird mit einer Zulässigkeitsfunktion (eine Funktion, die für den Maskierungspegel repräsentativ ist) beliefert, um den Pegel a herauszufinden. Der Pegel a wird durch Anheben oder Absenken der Zulässigkeitsfunktion gesteuert. Die Zulässigkeitsfunktion wird von einem (n - ai)-Funktionsgenerator 705, was anschließend erläutert wird, geliefert.
  • Das heißt, daß der Pegel a entsprechend dem zulässigen Rauschpegel aus der Gleichung (3) herausgefunden wird:
  • a = S - (n - ai) (3)
  • wobei i die Zahl ist, die nacheinander den kritischen Bändern vom Beginn von der unteren Seite zugeteilt wird, n und a Konstanten sind, wobei a > 0 und S die Intensität des Faltungs-Bark-Spektrums ist. In der Gleichung (1) zeigt (n - ai) die Zulässigkeitsfunktion. Bei der vorliegenden Ausführungsform kann durch Setzen n = 38 und a = 1 ein optimales Codieren ohne Verschlechterung der Tonqualität erzielt werden.
  • Der Pegel a wird auf diese Weise herausgefunden und zu einem Teiler 706 übertragen, um den Pegel a im Faltungsbereich zu entfalten. Durch dieses Entfalten wird das Maskierungsspektrum aus dem Pegel a herausgefunden. Dieses Maskierungsspektrum wird zum zulässigen Rauschpegel. Obwohl die Entfaltung komplexe logische Rechnungsschritte erfordert, wird diese bei der vorliegenden Ausführungsform in vereinfachter Weise durch Verwendung des Teilers 706 ausgeführt.
  • Das Maskierungsspektrum wird über eine Syntheseschaltung 707 zu einem Subtrahierer 708 übertragen, der mit einem Ausgangssignal der Basisband-Energieermittlungsschaltung 702 beliefert wird, d. h., den oben erwähnten Spektralkomponenten SB. Der Subtrahierer 708 subtrahiert das Maskierungsspektrum vom Spektrum SB, um die Bereiche der Spektralkomponenten SB zu maskieren, die niedriger sind als der Pegel des Maskierungsspektrums MS, wie in Fig. 11 gezeigt ist.
  • Ein Ausgangssignal des Subtrahierers 708 wird über eine Zulässigkeitsrausch-Korrekturschaltung 710 an einem Ausgangsanschluß 711 ausgegeben und von da zu einem nicht gezeigten ROM übertragen, in dem die Information, die die Anzahl der zugeteilten Bits betrifft, vorher gespeichert ist. Der ROM gibt die Information, die die Anzahl von zugeteilten Bits für jedes Band betrifft, in Abhängigkeit von einem Ausgangssignal der Subtraktionsschaltung 708, die über eine Zulässigkeitsrausch-Korrekturschaltung 710 beliefert wird, aus, d. h., bezüglich des Pegels einer Differenz zwischen den Energien der jeweiligen Bänder und Ausgangssignalen der Rauschpegel-Einstelleinrichtung. Die Information, die die Anzahl der zugeteilten Bits betrifft, wird zu den adaptiven Bitzuteilungs- und Codierschaltungen 22 bis 24 übertragen, um zu erlauben, daß die Frequenzbereichs-Spektraldaten von den MDCT- Schaltungen 13 bis 15 (Fig. 2) mit der Anzahl von Bits quantisiert werden, die den entsprechenden Bändern zugeteilt sind.
  • Zusammengefaßt quantisieren die adaptiven Bitzuteilungs- und Codierschaltungen 22 bis 24 (Fig. 2) die Bandbasis-Spektraldaten mit der Anzahl von Bits in Abhängigkeit von den Maskierungshöhen und dem Pegel der Differenz zwischen dem Ausgangssignal der Rauschpegel-Einstelleinrichtung und den Energien in den kritischen Bändern und den Bändern, die von den kritischen Bändern geteilt sind, um das Blockfließen in Betracht zu ziehen. Die Verzögerungsschaltung 709 (Fig. 9) ist dazu vorgesehen, die Spektralkomponenten SB von der Energieermittlungsschaltung 702 in Betrachtung der Verzögerung zu verzögern, die in dem Schaltungsaufbau stromaufwärts der Syntheseschaltung 707 erzeugt wird.
  • Die Syntheseschaltung 707 stellt das Maskierungsspektrum MS und Daten von der minimalen Hörbarkeitskurve RC von der Minimalhörbarkeitskurven-Erzeugungsschaltung 712 künstlich her, die die Charakteristik des menschlichen Hörsinnes zeigt, wie in Fig. 12 gezeigt ist. Wenn der absolute Rauschpegel niedriger ist als der der Minimalhörbarkeitskurve, wird das Rauschen nicht hörbar. Die Minimalhörbarkeitskurve RC unterscheidet sich von der Differenz im Wiedergabepegel sogar, obwohl das Codieren in derselben Weise ausgeführt wird. Da jedoch es keine markierte Differenz bei der Art zum Eingeben in den 16-Bit-Dynamikbereich bei Musik bei den vorhandenen digitalen Systemen gibt, kann vorausgesetzt werden, daß, wenn das Quantisierungsrauschen des Frequenzbereichs in der Nähe von 4 kHz, welches für das Ohr am besten wahrnehmbar ist, nicht gehört wird, das Quantisierungsrauschen, welches niedriger ist als der Pegel der Minimalhörbarkeitskurve, nicht in irgendeinem anderen Frequenzbereich gehört wird.
  • Wenn man annimmt, daß die Aufzeichnungs-/Wiedegabeeinrichtung so verwendet wird, daß das Rauschen in der Nähe von 4 kHz einer Wortlänge, die dem System eigen ist, nicht gehört wird, und der zulässige Rauschpegel durch Synthese der Minimalhörbarkeitskurve RC und des Maskierungsspektrums MS erhalten wird, kann der zulässige Rauschpegel bis zu dem Pegel sein, der durch die schraffierten Linien in Fig. 12 angedeutet ist. Bei der vorliegenden Ausführungsform paßt der Pegel von 4 kHz der Minimalhörbarkeitskurve zum Minimalpegel, der beispielsweise 20 Bits entspricht. In Fig. 12 ist außerdem das Signalspektrum SS gezeigt.
  • Die Zulässigkeitsrausch-Korrekturschaltung 710 korrigiert außerdem den zulässigen Rauschpegel im Ausgangssignal des Subtrahierers 708 auf der Basis der Information der Kurve gleicher Lautstärke, die von einer Korrekturinformations-Ausgabeschaltung 713 übertragen wird. Die Kurve gleicher Lautstärke ist eine Kennlinienkurve, die die Kennlinien des menschlichen Hörsinnes betrifft, und sie wird dadurch erhalten, daß der Tondrücke des Tons bei entsprechenden Frequenzen, der mit der gleichen Lautstärke wie dem natürlichen Ton von 1 kHz gehört wird, herausgefunden werden, und daß die Tondrücke mittels einer Kurve verbunden werden. Diese ist auch als Kurve gleicher Lautstärkeempfindlichkeit bekannt. Die Kurve gleicher Lautstärke beschreibt außerdem eine Kurve, die im wesentlichen die gleiche ist wie die Minimalhörbarkeitskurve, die in Fig. 12 gezeigt ist. Mit der Kurve gleicher Lautstärke wird der Ton in der Nähe von 4 kHz mit der gleichen Lautstärke wie der Ton von 1 kHz gehört, sogar, obwohl der Tondruck um 8 bis 10 dB gegenüber dem Ton von 1 kHz vermindert ist. Umgekehrt kann der Ton in der Nähe von 5 kHz nicht mit der gleichen Lautstärke wie der Ton von 1 kHz gehört werden, wenn der Tondruck nicht um ungefähr 15 dB höher ist als der des Tons von 1 kHz. Dadurch kann man sehen, daß das übermäßige Rauschen des Pegels der Minimalhörbarkeitskurve und innerhalb des zulässigen Rauschpegels vorzugsweise eine Frequenzcharakteristik hat, die durch eine Kurve dargestellt wird, die in Übereinstimmung mit der Kurve gleicher Lautstärke ist. Damit kann man sehen, daß die Korrektur des zulässigen Rauschpegels im Hinblick auf die Kurve gleicher Lautstärke gemäß der Charakteristik des menschlichen Hörsinnes ist.
  • Die Korrekturinformations-Ausgabeschaltung 713 kann so ausgebildet sein, um den zulässigen Rauschpegel auf der Basis der Information des Fehlers zwischen dem Ermittlungsausgangssignal des Volumens der Ausgangsinformation (Datenmenge) im Zeitpunkt der Quantisierung bei den adaptiven Bitzuteilungs- und Codierschaltungen 22 bis 24 und der Zielbitrate der zuletzt codierten Daten zu korrigieren. Es gibt Gelegenheiten, wo die Gesamtzahl von Bits, die durch zeitliche adaptive Bitzuteilung erhalten wird, sich für die Gesamtzahl der Bitzuteilungs-Einheitsblöcke von der vorher-festgelegten Anzahl von Bits (Zielzahl der Bits) unterscheidet, die durch die Bitrate der zuletzt codierten Daten bestimmt wird, und daher die Bitzuteilung wieder so gemacht wird, daß die Differenz gleich null wird. Das heißt, wenn die Gesamtzahl von zugeteilten Bits kleiner ist als die Zielzahl der Bits, werden die Bits entsprechend der Differenz zusätzlich entsprechenden Blockeinheiten zugeteilt, während, wenn die Gesamtzahl von zugeteilten Bits größer ist als die Zielzahl der Bits, werden die Bits entsprechend der Differenz deduktiv den entsprechenden Blockeinheiten zugeteilt.
  • Zu diesem Zweck wird ein Fehler der Gesamtzahl von zugeteilten Bits von der Zielzahl ermittelt, und Korrekturdaten zum Korrigieren der Anzahl von zugeteilten Bits werden durch die Korrekturinformations-Ausgabeschaltung 713 in Abhängigkeit von den Fehlerdaten ausgegeben. Wenn die Fehlerdaten die Verkürzung der Anzahl von Bits zeigen, ist es wahrscheinlich, daß mehr Bits pro Blockeinheit verwendet werden, so daß die Menge der Daten über der Zielanzahl der Bits liegt. Wenn die Fehlerdaten einen Überschuß der Anzahl von Bits zeigen, ist es wahrscheinlich, daß eine kleinere Anzahl von Bits pro Blockeinheit ausreicht, so daß die Menge der Daten geringer ist als die Zielanzahl. Somit spricht die Korrekturinformations-Ausgabeschaltung 713 auf die Fehlerdaten an, um die Korrekturdatenwerte auszugeben, durch die der zulässige Rauschpegel an einem Ausgangsanschluß des Subtrahierers 708 auf der Basis der Information der Kurve gleicher Lautstärke korrigiert wird. Die Korrekturwerte werden zur Zulässigkeitsrausch-Korrekturschaltung 710 übertragen, um das zulässige Rauschen vom Subtrahierer 708 zu korrigieren. Bei dem oben beschriebenen System werden Daten, die durch Verarbeiten des Orthogonal-Transformations-Ausgangsspektrums durch die Hilfsinformation erhalten werden, zur Quantisierung als Hauptinformation erhalten, während der Maßstabsfaktor, der den Zustand des Blockgleitens zeigt, oder die Wortlängendaten als Hilfsinformation zur Quantisierung erzeugt werden. Die Hauptinformation und die Hilfsinformation werden vom Codierer zum Decoder übertragen.
  • Fig. 13 zeigt den in Fig. 1 gezeigten ATC-Decoder 73, d. h., die Codierschaltungen zum Rekombinieren der oben erwähnten hochwirksamen codierten Signale. Die quantisierten MDCT-Signale der jeweiligen Bänder, d. h., Daten, die den Ausgangssignalen an den Ausgangsanschlüssen 25 bis 27 in Fig. 2 äquivalent sind, werden zu den Eingangsanschlüssen 152, 154 bzw. 156 geliefert, während die Blockgrößeninformation, d. h., Daten, die Ausgangssignalen an den Ausgangsanschlüssen 28 bis 30 in Fig. 2 äquivalent sind, zu Eingangsanschlüssen 153, 155 bzw. 157 geliefert werden. Decodierschaltungen 146, 147 und 148 annullieren die Zuteilung, wobei die adaptive Bitzuteilungsinformation verwendet wird. Die Frequenzbereichssignale werden durch IMDCT-Schaltungen 143, 144 und 145 in Zeitbereichssignale transformiert. Diese Teilbereichs-Zeitbereichssignale werden durch IQMF-Schaltungen 142 und 141 in Vollbereichssignale decodiert, die an einem Ausgangsanschluß 130 ausgegeben werden.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebenen Ausführungsformen beschränkt. Beispielsweise können zwei Aufzeichnungs-/Wiedergabeträger über ein Datenübertragungskabel miteinander verbunden sein, ohne daß es notwendig ist, zwei Träger zu haben, die in einem System eingebaut sind. Die vorliegende Erfindung kann nicht nur bei PCM-Audiosignalen angewandt werden, sondern auch bei digitalen Sprachsignalen oder digitalen Videosignalen. Auf die Synthese der oben erwähnten Minimalhörbarkeitskurve kann außerdem verzichtet werden in dem Fall, wo die Minimalhörbarkeitskurven-Erzeugungsschaltung 712 oder die Syntheseschaltung 707 weggelassen werden kann und ein Ausgangssignal des Subtrahierers 704 unmittelbar zum Subtrahierer 708 übertragen werden kann, nachdem dieses durch den Teiler 706 entfaltet ist. Außerdem kann eine breite Vielfalt von Bitzuteilungsverfahren verwendet werden, beispielsweise die feste Bitzuteilung, die Bitzuteilung auf der Basis von Signalbandenergien oder die Bitzuteilung, die aus einer Kombination einer festen Bitzuteilung und einer variablen Bitzuteilung besteht.
  • Aus den obigen Ausführungen kann man sehen, daß ein Verfahren bereitgestellt wird, die zeitliche Größe des Verarbeitungsblocks auszuwählen, wodurch eine zeitliche Größe des gewünschten Verarbeitungsblocks, der den Hörsinn betrifft, so festgelegt werden kann, wenn dies gewünscht ist, um Informationssignale, die zeitliche Schwankungen erfahren, zu komprimieren, um dadurch eine hocheffiziente Kompression und Expansion mit einer überragenden Tonqualität, die durch die Ohren wahrgenommen wird, sicherzustellen.

Claims (16)

1. Gerät zum Codieren eines Digitalsignals, welches umfaßt:
eine Einrichtung (11, 12), um das Digitalsignal in mehrere Zeitsignale zu unterteilen, die entsprechende Frequenzbänder einnehmen,
eine Einrichtung (13, 14, 15), um in jedem Band eine Umformung bezüglich Digitaldatenblöcken durchzuführen, die das Signal im Band darstellen, und
eine Einrichtung, die auf das Digitalsignal anspricht, um die Längen der Blöcke zu bestimmen,
dadurch gekennzeichnet, daß die Blocklängen-Bestimmungseinrichtung (19, 20, 21) die Länge eines laufenden Blocks in einem Band in Abhängigkeit von den zeitlichen Signalleistungen in diesem Band und in zumindest einem anderen der Bänder bestimmt.
2. Gerät nach Anspruch 1, wobei die Blöcke eine maximale Blocklänge haben und die Blocklängen-Bestimmungseinrichtung (19, 20, 21) eines jeden Bands die laufende Blocklänge in Abhängigkeit von zeitlicher Signalleistungsvariation in dem einen der Bänder über eine Zeitdauer bestimmt, die größer ist als eine Zeitdauer, die der maximalen Blocklänge entspricht, und
in Abhängigkeit von der Signalleistung in dem oder jedem anderen Frequenzband.
3. Gerät nach Anspruch 2, wobei die Blocklängen-Bestimmungseinrichtung außerdem eine Einrichtung (304, 305, 306) umfaßt, um die Signalleistung in jedem Frequenzband zu berechnen, und
eine Einrichtung (309), um die Signalleistungen in diesen Bändern zu vergleichen, wobei die Blocklänge als Antwort auf den Vergleich bestimmt wird.
4. Gerät nach Anspruch 3, wobei die Vergleichseinrichtung (309) die Signalleistungen über eine vorher-festgelegte Zeitdauer vergleicht.
5. Gerät nach Anspruch 2, 3 oder 4, wobei die Blocklängen-Bestimmungseinrichtung (19) des einen Bandes umfaßt:
eine Einrichtung (304), um die Signalleistung zu bestimmen,
eine Einrichtung (308), um die Variation der Signalleistung zu bestimmen, und
eine Einrichtung (307), um die Variationen der Signalleistung, die über die Zeit dauer bestimmt werden, die größer ist als die Zeitdauer, die der maximalen Blocklänge entspricht, zu speichern, und eine Blocklängen-Entscheidungsschaltung (310), um die Blocklänge in Abhängigkeit von der laufenden Variation der Signalleistung und den vorhergehenden gespeicherten Variationen der Signalleistung zu bestimmen.
6. Gerät nach Anspruch 5, wenn von Anspruch 3 oder 4 abhängig, wobei die Blocklängen-Bestimmungseinrichtung (19, 20, 21) außerdem umfaßt:
eine Einrichtung (311), um die Blocklänge, die durch die Entscheidungsschaltung bestimmt wird, in Abhängigkeit vom Vergleich durch die Vergleichseinrichtung (309) einzustellen.
7. Gerät nach Anspruch 1, 2, 3, 4, 5 oder 6, welches eine Einrichtung (312, 313, 314) umfaßt, um einen Blocklängenwert, der für zumindest einen Block bestimmt wird, der dem laufenden Block vorhergeht, zu speichern, und wobei die Blocklängen-Bestimmungseinrichtung die Blocklänge in Abhängigkeit von dem oder dem jeweils gespeicherten Blocklängenwert bestimmt.
8. Gerät nach einem Ansprüche 1 bis 7, welches außerdem eine Einrichtung (317) umfaßt, um eine Fensterfunktion auszuwählen, die bei dem laufenden Block anzuwenden ist, wobei die Fensterfunktion in Abhängigkeit von der Blocklänge, die für zumindest einen Block bestimmt wird, ausgewählt wird.
9. Gerät nach einem der Ansprüche 1 bis 8, wobei die Blöcke eine vorher-festgelegte minimale Länge haben und die Signalleistung die Leistung des Signals über eine vorherfestgelegte Zeitdauer ist, die geringer ist als die Zeit, die der minimalen Blocklänge entspricht.
10. Gerät nach einem der Ansprüche 1 bis 8, wobei die Blöcke eine vorher-festgelegte Minimallänge haben und die Signalleistung durch die absolute maximale Amplitude des Signals innerhalb eines Blocks dargestellt wird, der die Minimallänge hat.
11. Gerät nach einem der Ansprüche 1 bis 8, wobei die Blöcke eine vorher-festgelegte Minimallänge haben und die Signalleistung durch den Mittelwert des Signals innerhalb eines Blocks, der die Minimallänge hat, dargestellt wird.
12. Gerät nach einem der vorhergehenden Ansprüche, wobei die Umformung eines Modifizierte Diskrete Kosinustransformation (MDCT) ist.
13. Gerät nach einem der vorhergehenden Ansprüche, wobei die Bandbreite eines höheren Frequenzbandes größer ist als die Bandbreite eines niedrigeren Frequenzbandes.
14. Gerät nach Anspruch 13, wo zumindest drei Bänder vorhanden sind und die Bandbreiten der beiden untersten Bänder gleich sind.
15. Gerät nach einem vorhergehenden Ansprüche, wobei die Teilungseinrichtung eine Quadratur-Spiegelfiltereinrichtung (11, 12) umfaßt.
16. Gerät nach einem der vorhergehenden Ansprüche, welches eingerichtet ist, ein Audiosignal zu codieren.
DE69429687T 1993-03-09 1994-03-09 System zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten Expired - Lifetime DE69429687T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04794493A JP3186307B2 (ja) 1993-03-09 1993-03-09 圧縮データ記録装置及び方法

Publications (2)

Publication Number Publication Date
DE69429687D1 DE69429687D1 (de) 2002-03-14
DE69429687T2 true DE69429687T2 (de) 2002-08-14

Family

ID=12789480

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69429687T Expired - Lifetime DE69429687T2 (de) 1993-03-09 1994-03-09 System zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten

Country Status (4)

Country Link
US (1) US5819214A (de)
EP (1) EP0615348B1 (de)
JP (1) JP3186307B2 (de)
DE (1) DE69429687T2 (de)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
WO1996014695A1 (en) * 1994-11-04 1996-05-17 Philips Electronics N.V. Encoding and decoding of a wideband digital information signal
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
US6353807B1 (en) 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
JP2000101439A (ja) 1998-09-24 2000-04-07 Sony Corp 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体
JP3992419B2 (ja) * 2000-03-27 2007-10-17 パイオニア株式会社 情報再生装置
WO2002056297A1 (en) * 2001-01-11 2002-07-18 Sasken Communication Technologies Limited Adaptive-block-length audio coder
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7133228B2 (en) * 2003-10-10 2006-11-07 Seagate Technology Llc Using data compression to achieve lower linear bit densities on a storage medium
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US9541658B2 (en) * 2007-08-02 2017-01-10 Westerngeco L. L. C. Dynamically allocating different numbers of bits to windows of a series representing a seismic trace
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
EP2374211B1 (de) * 2008-12-24 2012-04-04 Dolby Laboratories Licensing Corporation Audiosignallautheitbestimmung und modifikation im frequenzbereich
WO2014053519A1 (en) 2012-10-01 2014-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Scalable video coding using inter-layer prediction of spatial intra prediction parameters
PL2959482T3 (pl) 2013-02-20 2019-10-31 Fraunhofer Ges Forschung Urządzenie i sposób do kodowania lub dekodowania sygnału audio przy użyciu zakładki zależnej od lokalizacji transjentu
CN104579209A (zh) * 2014-12-22 2015-04-29 宁波市鄞州奥创电子有限公司 一种信号压缩电路及录音话筒信号压缩器
CN110211580B (zh) * 2019-05-15 2021-07-16 海尔优家智能科技(北京)有限公司 多智能设备应答方法、装置、系统及存储介质

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3349183A (en) * 1963-10-29 1967-10-24 Melpar Inc Speech compression system transmitting only coefficients of polynomial representations of phonemes
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CH645501GA3 (de) * 1981-07-24 1984-10-15
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPH07118159B2 (ja) * 1982-12-06 1995-12-18 ソニー株式会社 Pcm信号記録方法
DE3314384A1 (de) * 1983-04-21 1984-10-25 Siemens AG, 1000 Berlin und 8000 München Uebertragungssystem
JPH07118160B2 (ja) * 1983-06-18 1995-12-18 ソニー株式会社 ディジタル情報信号の記録方法
US4516241A (en) * 1983-07-11 1985-05-07 At&T Bell Laboratories Bit compression coding with embedded signaling
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
JPS61107818A (ja) * 1984-10-30 1986-05-26 Nec Corp エントロピ−符号化方式とその装置
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4748579A (en) * 1985-08-14 1988-05-31 Gte Laboratories Incorporated Method and circuit for performing discrete transforms
DE3688980T2 (de) * 1986-10-30 1994-04-21 Ibm Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
AU604807B2 (en) * 1986-12-19 1991-01-03 Sony Corporation Data recorder and method
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4882754A (en) * 1987-08-25 1989-11-21 Digideck, Inc. Data compression system and method with buffer control
JP2618916B2 (ja) * 1987-09-10 1997-06-11 富士通株式会社 動き補償のブロックサイズ決定方法
US4964166A (en) * 1988-05-26 1990-10-16 Pacific Communication Science, Inc. Adaptive transform coder having minimal bit allocation processing
JPH0213135A (ja) * 1988-06-30 1990-01-17 Sony Corp ディジタル信号伝送装置
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
EP0370277A3 (de) * 1988-11-24 1991-09-18 Siemens Aktiengesellschaft Subband-Übertragungssystem
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
ES2065524T3 (es) * 1989-01-27 1995-02-16 Dolby Lab Licensing Corp Codificador, descodificador, y codificador/descodificador de transformacion con tiempo de retardo corto para alta calidad de audio.
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
FR2653280B1 (fr) * 1989-10-13 1992-01-10 France Etat Dispositif d'allocation de bits pour signal audio-numerique transforme, a quantification adaptative sur critere psycho-auditif.
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
EP0428156B1 (de) * 1989-11-14 1996-08-21 Nec Corporation Adaptive Transformationskodierung durch optimale Blocklängenselektion in Abhängigkeit von Unterschieden zwischen aufeinanderfolgenden Blöcken
CA2032765C (en) * 1989-12-21 1995-12-12 Hidetaka Yoshikawa Variable rate encoding and communicating apparatus
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
JP3185214B2 (ja) * 1990-06-12 2001-07-09 日本電気株式会社 改良dctの順変換計算装置および逆変換計算装置
JPH0472909A (ja) * 1990-07-13 1992-03-06 Sony Corp オーディオ信号の量子化誤差低減装置
JP3033156B2 (ja) * 1990-08-24 2000-04-17 ソニー株式会社 ディジタル信号符号化装置
JP3141241B2 (ja) * 1990-08-24 2001-03-05 ソニー株式会社 ディスク記録装置及びディスク再生装置
JP2619561B2 (ja) * 1990-09-28 1997-06-11 株式会社日立製作所 知識処理システム及びその構築方法
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
EP0506394A2 (de) * 1991-03-29 1992-09-30 Sony Corporation Einrichtung zur Kodierung von digitalen Signalen
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
US5388209A (en) * 1991-08-02 1995-02-07 Sony Corporation Apparatus for high-speed recording compressed digital data with increased compression
CA2075156A1 (en) * 1991-08-02 1993-02-03 Kenzo Akagiri Digital encoder with dynamic quantization bit allocation
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
JP3198550B2 (ja) * 1991-09-03 2001-08-13 ソニー株式会社 圧縮データ記録方法及び圧縮データ記録再生装置
JP3158556B2 (ja) * 1991-09-27 2001-04-23 ソニー株式会社 ディスク記録装置及びディスク再生装置
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0535889B1 (de) * 1991-09-30 1998-11-11 Sony Corporation Verfahren und Anordnung zur Audiodatenkompression
JP3189401B2 (ja) * 1992-07-29 2001-07-16 ソニー株式会社 音声データ符号化方法及び音声データ符号化装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
JPH06180948A (ja) * 1992-12-11 1994-06-28 Sony Corp ディジタル信号処理装置又は方法、及び記録媒体
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium

Also Published As

Publication number Publication date
JPH0738443A (ja) 1995-02-07
JP3186307B2 (ja) 2001-07-11
US5819214A (en) 1998-10-06
DE69429687D1 (de) 2002-03-14
EP0615348B1 (de) 2002-01-23
EP0615348A1 (de) 1994-09-14

Similar Documents

Publication Publication Date Title
DE69429687T2 (de) System zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten
DE69434225T2 (de) Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger
DE69321201T2 (de) Gerät und Verfahren zur Digitalsignalverarbeitung
DE69422343T2 (de) Gerät, verfahren und system zur komprimierung eines digitalen eingangssignals in mehr als einem kompressionsmodus
DE4221321B4 (de) Schaltungsanordnung zur Aufzeichnung und/oder Wiedergabe von komprimierten Daten sowie Signalverarbeitungsverfahren
DE69737302T2 (de) Verfahren zum Codieren von digitalen Audiosignalen
DE4225434A1 (de) Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
US5590108A (en) Encoding method and apparatus for bit compressing digital audio signals and recording medium having encoded audio signals recorded thereon by the encoding method
DE69829242T2 (de) Tonsignalkodierverfahren und -gerät
DE60015030T2 (de) Auf Block Umschaltung basierender Teilband-Audiokodierer
DE69837738T2 (de) Dekodierverfahren und -gerät
DE69325312T2 (de) Kompressionskodierung und -dekodierung digitaler Audiosignale
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE69427222T2 (de) Digitaler signalprozessor, verfahren zum verarbeiten digitaler signale und medium zum aufnehmen von signalen
DE69431025T2 (de) Signalkodier- oder -dekodiergerät und Aufzeichnungsmedium
DE60020663T2 (de) Verfahren zur Formatierung eines Audiodatenstroms
KR100391762B1 (ko) 압축데이터기록장치및압축데이터기록방법과압축데이터재생방법
US5608713A (en) Bit allocation of digital audio signal blocks by non-linear processing
WO1990009063A1 (de) Verfahren zur übertragung eines signals
DE69323047T2 (de) Gerät und Verfahren zur Aufzeichnung und Wiedergabe von komprimierten Daten
EP0691751B1 (de) Verfahren und vorrichtung zur informationskompression und vorrichtung zum aufnehmen/übertragen komprimierter informationen
US5642383A (en) Audio data coding method and audio data coding apparatus
JPH08162964A (ja) 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
JP3334374B2 (ja) ディジタル信号圧縮方法及び装置
DE69723412T2 (de) Codierung einer vielzahl von datensignalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition