JP2025104457A - Learning data rights management system - Google Patents
Learning data rights management system Download PDFInfo
- Publication number
- JP2025104457A JP2025104457A JP2023222279A JP2023222279A JP2025104457A JP 2025104457 A JP2025104457 A JP 2025104457A JP 2023222279 A JP2023222279 A JP 2023222279A JP 2023222279 A JP2023222279 A JP 2023222279A JP 2025104457 A JP2025104457 A JP 2025104457A
- Authority
- JP
- Japan
- Prior art keywords
- learning data
- model
- information
- data
- management unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明の実施形態は、生成AIモデルなどの機械学習モデルに用いられる学習データの権利管理技術に関する。 An embodiment of the present invention relates to a technology for managing rights to training data used in machine learning models such as generative AI models.
AIモデル等の機械学習モデルの生成、及び機械学習モデルを使用した事業が盛んである。特に近年は、生成AIと呼ばれる人工知能を使って新しいコンテンツや新しいデータを生成する技術が注目されている。 The generation of machine learning models such as AI models and businesses using machine learning models are thriving. In particular, in recent years, technology that uses artificial intelligence known as generative AI to generate new content and new data has been attracting attention.
生成AIは、学習データに基づいてパターン等を学習し、新しいコンテンツや新しいデータを生成することができる。この生成AIは、ディープラーニング(深層学習)などの機械学習を用いて構築された機械学習モデルである。 Generative AI can learn patterns and other information based on training data and generate new content and new data. This generative AI is a machine learning model built using machine learning techniques such as deep learning.
学習データの権利管理システムを提供することを目的とする。 The purpose is to provide a rights management system for learning data.
実施形態の権利管理システムは、新しいコンテンツ又は新しいデータを生成する生成AIモデルに用いられる学習データの権利管理を行う。権利管理システムは、学習データ提供者の学習データに学習データIDを割り当て、学習データIDが割り当てられる学習データの権利情報の登録を受け付けるとともに、学習データに対する利用許諾申請をモデル開発者から受け付ける学習データ管理部と、利用許諾された学習データを用いて生成された生成AIモデルの登録を受け付け、使用された学習データの学習データIDと紐付くモデル登録情報を生成するとともに、登録された生成AIモデルに対する利用許諾申請を事業者から受け付けるモデル管理部と、生成AIモデルによって生成されたコンテンツ又はデータを通じて事業収益を得る事業者に対し、利用許諾された生成AIモデルに紐付く学習データの権利情報に応じた使用料を算出し、事業者から入金された使用料を集計して学習データ提供者別に分配金を算出する使用料管理部と、を有する。 The rights management system of the embodiment performs rights management of learning data used in a generative AI model that generates new content or new data. The rights management system has a learning data management unit that assigns a learning data ID to the learning data of the learning data provider, accepts registration of rights information for the learning data to which the learning data ID is assigned, and accepts a license application for the learning data from the model developer, a model management unit that accepts registration of a generative AI model generated using the licensed learning data, generates model registration information linked to the learning data ID of the used learning data, and accepts a license application for the registered generative AI model from a business, and a usage fee management unit that calculates a usage fee according to the rights information of the learning data linked to the licensed generative AI model for a business that earns business revenue through content or data generated by the generative AI model, and calculates a distribution amount for each learning data provider by aggregating the usage fees paid by the business.
以下、実施形態につき、図面を参照して説明する。 The following describes the embodiment with reference to the drawings.
機械学習モデルは、学習データを用いた学習処理を通じて生成される。機械学習モデルは、大きく2つに分けることができる。 Machine learning models are generated through a learning process using training data. Machine learning models can be broadly divided into two types.
第1の機械学習モデルは、情報を整理したり分類したりして予測や検査などを行うAIモデルであり、画像認識モデルや音声認識モデルなどが挙げられる。この第1の機械学習モデルの特徴は、決められたアクションを自動的に行い、学習したデータに基づいて入力データに対する予測結果、検査結果などの適切な回答を出力することにある。 The first machine learning model is an AI model that organizes and classifies information to make predictions and inspections, and examples of this include image recognition models and voice recognition models. The characteristic of this first machine learning model is that it automatically performs predetermined actions and outputs appropriate answers, such as prediction results and inspection results for input data, based on the learned data.
一方、第2の機械学習モデルは、コンテンツやデータを生成(創出)する生成AIモデルであり、テキスト生成AIモデル、音声生成AIモデル、画像生成AIモデル、動画生成AIモデルなどの様々な種類がある。生成AIモデルは、文章(テキスト)、音声、音楽、画像、動画といったコンテンツを新たに生成することを特徴とする。 On the other hand, the second type of machine learning model is a generative AI model that generates (creates) content and data, and there are various types such as text generation AI models, voice generation AI models, image generation AI models, and video generation AI models. Generative AI models are characterized by newly generating content such as sentences (text), voice, music, images, and videos.
そして、近年、生成AIの登場によって学習データの取り扱い方をどのようにすべきか様々な意見や課題が噴出している。例えば、音声作品や映像作品に声だけで出演する声優(俳優、ナレーター)の音声データを用いて学習処理した音声生成AIは、声優の音声データに依存した音声コンテンツを新たに生成することができる。人が作ったコンテンツであるか、生成AIが作ったコンテンツであるかの議論は別として、学習データに対して権利を有する者が、自身の音声データを学習データに使用した音声生成AIによって得られた収益と、無関係とは言えない。 In recent years, the emergence of generative AI has sparked a flurry of opinions and issues about how training data should be handled. For example, a voice generation AI that has been trained using the voice data of a voice actor (actor, narrator) who appears in audio or video works only as a voice can generate new audio content that relies on the voice actor's voice data. Regardless of the debate over whether the content is created by a person or by a generative AI, it cannot be said that those who hold the rights to the training data are unrelated to the revenue earned by a voice generation AI that uses their own voice data as training data.
このように生成AIによって生成された新たなコンテンツや新たなデータは、生成AIを構築するために使用した学習データに依存することから、学習データの無秩序な使用は、学習データに対して権利を有する者を保護する観点において適切な状況ではない。そこで、学習データに対して権利を有する者が保護されるプラットフォーム、言い換えれば、生成AIを利用して新たなコンテンツやビジネスを生み出す際に、関係者同士を良好に繋ぐことができるプラットフォーム作りが急務である。 Because new content and new data generated by generative AI in this way depend on the training data used to build the generative AI, unregulated use of the training data is not an appropriate situation from the perspective of protecting those who have rights to the training data. There is an urgent need to create a platform that protects those who have rights to the training data; in other words, a platform that can effectively connect the parties involved when using generative AI to create new content and businesses.
実施形態の権利管理システムは、学習データ提供者、モデル開発者、及び生成AIモデルを使用した事業を行う事業者を一元的に管理する権利管理プラットフォームを提供し、事業収益をもたらす生成AIモデルに寄与した学習データに対し、利益分配を行うことができる仕組みを実現する。 The rights management system of the embodiment provides a rights management platform that centrally manages training data providers, model developers, and businesses that conduct business using generative AI models, and realizes a mechanism for profit sharing for training data that contributes to generative AI models that generate business revenue.
また、別の観点において、事業者は、出所不明な学習データを用いた生成AIモデルを使用する場合、リスクを負う可能性がある。例えば、学習データに著作物が使用されている場合、許諾を必要する場合がある。したがって、どのような学習データを使って生成AIモデルが開発されたのかが明確に把握できれば、リスクを回避することができると共に、学習データに基づく品質や生成AIモデルの価値をアピールすることができる。また、モデル開発者も、事業者に対して学習データの出所を明確にすることができ、取引相手である事業者に対してアピールすることができる。権利管理プラットフォームを通じて生成AIモデルの開発及び生成AIモデルを使用した事業の価値の向上を図ることができる。 From another perspective, businesses may incur risks when using generative AI models that use training data of unknown origin. For example, if copyrighted work is used in the training data, permission may be required. Therefore, if it is possible to clearly understand what training data was used to develop a generative AI model, risks can be avoided and the quality based on the training data and the value of the generative AI model can be promoted. Model developers can also clearly state the origin of the training data to businesses and promote it to business partners. Through a rights management platform, it is possible to improve the development of generative AI models and the value of businesses that use generative AI models.
(第1実施形態)
図1から図6は、第1実施形態を説明するための図である。
First Embodiment
1 to 6 are diagrams for explaining the first embodiment.
図1は、生成AIモデルを含む機械学習モデルに用いられる学習データの権利管理システムの概略説明図である。権利管理システムは、管理装置100を備える。管理装置100は、学習データ提供者、モデル開発者、及び事業者が利用する権利管理プラットフォームを提供する。
Figure 1 is a schematic diagram of a rights management system for training data used in machine learning models, including generative AI models. The rights management system includes a
以下の説明では、機械学習モデルとして、生成AIモデルを一例に説明する。学習データは、文章(テキストデータ)、音声データ、音楽データ、画像データ、動画データなど、生成AIモデルに用いられるデータであり、本実施形態の権利管理プラットフォームは、学習データの種別や内容は問わず、生成AIモデルの学習処理(モデル生成処理)に用いられる学習データの権利管理を行う。 In the following explanation, a generative AI model will be used as an example of a machine learning model. The learning data is data used in the generative AI model, such as sentences (text data), audio data, music data, image data, and video data, and the rights management platform of this embodiment performs rights management of the learning data used in the learning process (model generation process) of the generative AI model, regardless of the type or content of the learning data.
学習データに対して権利を有する者を学習データ提供者と称する。例えば、学習データが音声データである場合、学習データ提供者は、音声を提供する個人又はその個人が属する会社等の組織である。例えば、声優や俳優などの個人、声優や俳優が属する会社がこれに相当する。 A person who has rights to training data is called a training data provider. For example, if the training data is voice data, the training data provider is an individual who provides the voice or an organization such as a company to which that individual belongs. For example, this would include an individual such as a voice actor or actor, or a company to which a voice actor or actor belongs.
モデル開発者は、学習データ提供者によって提供される学習データを使用した学習処理を行い、生成AIモデルを構築して生成する機械学習モデルの開発者である。権利管理プラットフォームに登録される生成AIモデルの種類や用途は、特に限定されず、権利管理プラットフォームに登録された学習データを使用した生成AIモデルであればよい。なお、モデル開発者は、生成AIモデルだけではなく、生成AIモデルを含むコンピュータシステムを開発し、事業者に提供することができる。モデル開発者は、個人や会社等の組織である。 A model developer is a developer of a machine learning model that performs learning processing using the learning data provided by the learning data provider and builds and generates a generative AI model. There are no particular limitations on the type or use of the generative AI model registered in the rights management platform, as long as it is a generative AI model that uses the learning data registered in the rights management platform. Note that a model developer can develop not only a generative AI model, but also a computer system that includes a generative AI model and provide it to a business operator. A model developer is an individual or an organization such as a company.
事業者は、モデル開発者から生成AIモデルの提供を受けて事業を行う者である。例えば、事業者は、モデル開発者から生成AIモデルを購入したり、モデル開発者が提供する生成AIモデルを含むコンピュータシステムの使用権を購入したりし、生成AIモデルによって生み出されるコンテンツやデータを提供したり、生成AIモデルによって生み出されるコンテンツやデータを利用したサービスを提供する。また、事業者は、モデル開発者と取引契約を結び、生成AIモデルの開発を依頼することもできる。事業者は、生成AIモデル又は生成AIモデルを含むコンピュータシステムを事業展開して収益を得る、営利を目的として事業を営む個人又は会社等の組織である。 An operator is a person who conducts a business by receiving a generative AI model from a model developer. For example, an operator may purchase a generative AI model from a model developer or purchase the right to use a computer system including a generative AI model provided by a model developer, and provide content or data generated by the generative AI model or a service using the content or data generated by the generative AI model. An operator may also enter into a business agreement with a model developer and request the development of a generative AI model. An operator is an individual or a company or other organization that operates a profit-making business and earns revenue by operating a generative AI model or a computer system including a generative AI model.
学習データ提供者、モデル開発者、及び事業者は、権利管理システム(管理装置100)を利用する事前準備として、ユーザ登録を行う。 Training data providers, model developers, and businesses register as users in preparation for using the rights management system (management device 100).
学習データ提供者は、権利管理システムに学習データを登録する。権利管理システムは、登録された学習データを識別化する。具体的には、学習データに学習データIDを割り当てる。そして、学習データIDが割り当てられた学習データの権利情報の登録を受け付ける。学習データの識別化及び権利情報の登録により、学習データの利用許諾準備が整う。 The learning data provider registers the learning data in the rights management system. The rights management system identifies the registered learning data. Specifically, it assigns a learning data ID to the learning data. It then accepts registration of rights information for the learning data to which the learning data ID has been assigned. With the learning data identified and the rights information registered, the learning data is ready for licensing.
なお、学習データは、複数のデータ群、すなわち、データセットとして登録することができる。複数の学習データ群で構成されたデータセットが登録される場合は、学習データIDは、データセット及びデータセットに含まれる複数の学習データそれぞれが識別可能に割り当てられる。なお、学習データの登録は、データセット群でなくてもよく、例えば、1つの学習データを登録可能に制御することができる。 The learning data can be registered as multiple data groups, i.e., a dataset. When a dataset made up of multiple learning data groups is registered, a learning data ID is assigned so that the dataset and each of the multiple learning data included in the dataset can be identified. The learning data does not have to be registered as a dataset group; for example, it can be controlled so that a single learning data can be registered.
モデル開発者は、権利管理システムに登録された学習データの検索、学習データに付随する権利情報の閲覧、利用許諾申請などの機能を利用することができる。権利管理システムは、モデル開発者からの学習データに対する利用許諾申請を受け付け、利用許諾処理を行う。モデル開発者は、利用許諾された学習データを権利管理システムから取得することができる。 Model developers can use functions such as searching for training data registered in the rights management system, viewing rights information attached to training data, and applying for a license. The rights management system accepts license applications for training data from model developers and performs the license processing. Model developers can obtain licensed training data from the rights management system.
モデル開発者は、取得した学習データを使用し、生成AIモデルを生成する。モデル開発者は、学習データを用いて生成された生成AIモデルを、権利管理システムに登録する。権利管理システムは、生成AIモデルの登録を受け付け、使用された学習データの学習データIDと紐付くモデル登録情報を生成する。つまり、生成された生成AIモデルと、使用された学習データとを紐付け、生成AIモデルを識別化する。これにより、生成AIモデルの利用許諾準備が整う。 The model developer uses the acquired learning data to generate a generative AI model. The model developer registers the generative AI model generated using the learning data in the rights management system. The rights management system accepts the registration of the generative AI model, and generates model registration information linked to the learning data ID of the used learning data. In other words, the generated generative AI model is linked to the used learning data, and the generative AI model is identified. This makes it possible to license the generative AI model.
なお、モデル開発者が学習データを取得する方法は、権利管理システムを通じて管理装置100から学習データをダウンロードして取得する第1のケースと、権利管理システムを介さずに学習データを取得する第2のケースとがある。第2のケースは、例えば、学習データ提供者から直接、学習データを取得することができる。
The model developer can obtain the training data in two ways: in the first case, the training data is downloaded from the
第1のケースの場合、権利管理システムからダウンロードした学習データであるため、生成AIモデルは、利用許諾済みの学習データを使用して生成されるが、第2のケースの場合、権利管理システムを介した学習データの提供ではないため、権利管理システム上では利用許諾されていない状態の学習データを使用して生成AIモデルが生成される場合がある。この場合、モデル開発者は、生成AIモデルの生成に使用した学習データに対して後から利用許諾を申請することができる。例えば、生成AIモデルを登録する際に、使用した学習データを検索し、権利管理システムに登録されている学習データと生成AIモデルとを紐付けるように構成することができる。なお、第2のケースであっても、学習データを使用して生成AIモデルを生成する前に、権利管理システムにアクセスして、該当の学習データに対する利用許諾を申請することができる。この場合、利用許諾された学習データを使用して生成AIモデルが生成されることになる。 In the first case, since the learning data is downloaded from the rights management system, the generative AI model is generated using the learning data that has been licensed for use. In the second case, since the learning data is not provided via the rights management system, the generative AI model may be generated using learning data that has not been licensed for use on the rights management system. In this case, the model developer can later apply for a license for the learning data used to generate the generative AI model. For example, when registering the generative AI model, the model developer can search for the learning data used and link the learning data registered in the rights management system to the generative AI model. Even in the second case, the model developer can access the rights management system and apply for a license for the relevant learning data before generating the generative AI model using the learning data. In this case, the generative AI model will be generated using the licensed learning data.
事業者は、モデル開発者との間で個別に取引を行う。事業者は、モデル開発者から所望の生成AIモデルを取得したり、モデル開発者が提供する生成AIモデルを含むコンピュータシステムの使用権を得たりする。事業者は、事業で使用する生成AIモデルに対して、権利管理システムに利用許諾申請を行う。権利管理システムは、事業者からの登録された生成AIモデルに対する利用許諾申請を受け付け、事業者と生成AIモデルとを紐付ける。これにより、生成AIモデルを使用した事業が、学習データと紐付くことになる。 Businesses conduct individual transactions with model developers. Businesses acquire desired generative AI models from model developers, and obtain the right to use computer systems that include generative AI models provided by model developers. Businesses submit license applications to the rights management system for generative AI models to be used in their business. The rights management system accepts license applications from businesses for registered generative AI models, and links the business to the generative AI model. This links the business that uses the generative AI model to the training data.
ここで、学習データ及び生成AIモデルの各利用許諾について説明する。学習データの利用許諾は、学習データとモデル開発者とを紐付ける処理である。すなわち、学習データの利用許諾は、モデル開発者がどの学習データを使用したかの履歴を残すものである。このとき、利用許諾の形式は任意であり、例えば、公知の利用許諾契約を適用した仕組みであってもよいし、モデル開発者が権利管理システムに登録された学習データの使用を認証(許可)する仕組みであってもよい。したがって、学習データの利用許諾申請とは、モデル開発者が、権利管理システムに登録された学習データを使用する(使用した)ことを申し出る行為であり、学習データの使用を申し出たモデル開発者と、該当の学習データ(学習データ提供者)を紐付ける処理が利用許諾処理である。 Here, we will explain the licenses for use of the training data and the generated AI model. The license for use of the training data is a process that links the training data with the model developer. In other words, the license for use of the training data leaves a history of which training data the model developer has used. In this case, the form of the license is arbitrary, and may be, for example, a mechanism that applies a publicly known license agreement, or a mechanism in which the model developer authenticates (permits) the use of the training data registered in the rights management system. Therefore, a license application for use of the training data is an act by which the model developer offers to use (have used) the training data registered in the rights management system, and the process of linking the model developer who has offered to use the training data with the relevant training data (training data provider) is the license process.
同様に、生成AIモデルの利用許諾は、モデル開発者と事業者とを紐付ける処理であり、事業者がどの生成AIモデルを使用して事業を行うのかの履歴を残すための処理である。生成AIモデルの利用許諾の形式も任意であり、例えば、公知の利用許諾契約を適用した仕組みであってもよい。したがって、生成AIモデルの利用許諾申請とは、事業者が、権利管理システムに登録された生成AIモデルを使用する(使用した)ことを申し出る行為であり、生成AIモデルの使用を申し出た事業者と、該当の生成AIモデルを紐付ける処理が利用許諾処理である。 Similarly, the license for a generated AI model is a process that links a model developer with a business operator and is a process for keeping a history of which generated AI model the business operator is using to conduct business. The format of the license for a generated AI model is also arbitrary, and may be, for example, a mechanism that applies a publicly known license agreement. Therefore, a license application for a generated AI model is an act by a business operator offering to use (have used) a generated AI model registered in a rights management system, and the process of linking the business operator that has offered to use the generated AI model with the relevant generated AI model is the license process.
次に、権利管理システムは、利用許諾された生成AIモデルに紐付く学習データの権利情報に応じて事業者が支払う使用料を算出し、事業者に対して使用料の請求処理を行う。このとき、事業者は、利用許諾された生成AIモデルに関する事業収益を含む事業情報(収益関連情報)を権利管理システムに登録(報告)する。権利管理システムは、申告があった事業収益に基づいて事業者に請求する使用料を算出することができる。事業者は、請求された使用料を支払う。権利管理システムは、事業者から入金された使用料を集計して学習データ提供者別に分配金を算出する。算出された分配金は、学習データ提供者の振込先に入金される。 Next, the rights management system calculates the usage fee to be paid by the business operator according to the rights information of the learning data linked to the licensed generative AI model, and performs a process of billing the business operator for the usage fee. At this time, the business operator registers (reports) business information (revenue-related information) including business revenue related to the licensed generative AI model to the rights management system. The rights management system can calculate the usage fee to be billed to the business operator based on the reported business revenue. The business operator pays the billed usage fee. The rights management system tallys up the usage fees paid by the business operators and calculates distribution amounts for each learning data provider. The calculated distribution amounts are deposited into the bank account of the learning data provider.
このように権利管理システムは、学習データ提供者、モデル開発者、及び事業者を一元的に管理する権利管理プラットフォームを提供し、事業収益をもたらす生成AIモデルに寄与した学習データに対し、利益分配を行う仕組みを実現することができる。 In this way, the rights management system provides a rights management platform that centrally manages training data providers, model developers, and businesses, and can realize a mechanism for sharing profits from training data that contributes to generative AI models that generate business revenue.
図2は、本実施形態の権利管理システムのシステム構成及び機能ブロックを示す図である。権利管理システムは、管理装置100を含んで構成されている。管理装置100は、通信装置110、制御装置120、及び記憶部130を含む。学習データ提供者、モデル開発者、及び事業者は、IP網等のネットワークを通じて、それぞれのユーザ端末から管理装置100に接続し、権利管理プラットフォームを使用する。
Figure 2 is a diagram showing the system configuration and functional blocks of the rights management system of this embodiment. The rights management system is configured to include a
制御装置120は、ユーザインターフェース制御部121、ユーザ管理部122、学習データ管理部123、モデル管理部124、使用料管理部125を含んで構成されている。
The control device 120 includes a user
ユーザインターフェース制御部121は、学習データ提供者、モデル開発者、及び事業者の各ユーザ端末に、権利管理システムを利用するための各種画面を提供し、ユーザ端末の操作に応じた画面制御を行う処理部である。
The user
ユーザ管理部122は、ユーザ登録画面を通じたユーザ登録機能を提供する。ユーザ管理部122は、登録制御部1221を備える。登録制御部1221は、学習データ提供者に対して学習データ提供者登録画面を通じて入力されたユーザ情報を、学習データ提供者別に記憶装置130に記憶する。学習データ提供者のユーザ情報は、学習データ提供者ID、ログインパスワード、登録者情報(氏名、住所、連絡先、メールアドレス等)、組織情報(組織名、住所、連絡先、メールアドレス等)、登録種別(学習データ提供者を示す種別)、振込先情報(使用料振込先情報など)などを含む。
The
さらに、登録制御部1221は、モデル開発者に対してモデル開発者登録画面を通じて入力されたユーザ情報を、モデル開発者別に記憶装置130に記憶する。モデル開発者のユーザ情報は、モデル開発者ID、ログインパスワード、登録者情報(氏名、住所、連絡先、メールアドレス等)、組織情報(組織名、住所、連絡先、メールアドレス等)、登録種別(モデル開発者を示す種別)などを含む。
Furthermore, the
また、登録制御部1221は、事業者に対して事業者登録画面を通じて入力されたユーザ情報を、事業者別に記憶装置130に記憶する。事業者のユーザ情報は、事業者ID、ログインパスワード、登録者情報(氏名、住所、連絡先、メールアドレス等)、組織情報(組織名、住所、連絡先、メールアドレス等)、登録種別(事業者を示す種別)、使用料決済情報(クレジットカード情報、口座振替情報など)などを含む。
The
次に、学習データ管理部123は、学習データ登録制御部1231、学習データ権利情報管理部1232、学習データ同一性管理部1233、学習データ利用許諾管理部1234を含む。
Next, the learning
学習データ登録制御部1231は、学習データ登録画面を通じて管理装置100にアップロードされた学習データに、学習データIDを割り当て、記憶装置130に記憶する。
The learning data
学習データ権利情報管理部1232は、学習データ提供者のユーザ端末を通じた権利情報の入力制御を行うとともに、入力された権利情報と学習データIDを関連付けて記憶装置130に記憶する。権利情報は、利用許諾可否、利用許諾範囲、利用不可コンテンツ情報、料率設定情報などを含むことができる。利用許諾範囲は、学習データを用いて生成された生成AIモデルの利用目的や用途の範囲を規定した情報である。例えば、生成AIモデルが非営利目的で利用される場合は許可するが、生成AIモデルが営利目的で利用される場合は許可しない、といった学習データの利用目的を設定したり、生成AIモデルを社内教育で利用する場合は許可するといった用途を設定したりすることができる。利用不可コンテンツ情報は、生成AIモデルによって生成されたコンテンツやデータ、又は生成AIモデルを利用して提供されるサービスの提供範囲、年齢制限などを規定した情報である。例えば、12歳以下の子供に提供するコンテンツやデータ、サービスに利用される生成AIモデルへの適用は許可しない、といった制限を設けることができる。
The learning data right
料率設定情報は、学習データの使用料を規定した情報である。使用料の規定は、任意であるが、例えば、生成AIモデルの学習処理に使用した学習データ数に応じた使用料、生成AIモデルの販売価格に応じた使用料、事業者が生成AIモデルを用いた事業で得られた収益に対する使用料、などを設定することができる。 The rate setting information is information that specifies the usage fee for the training data. The usage fee can be specified arbitrarily, but it is possible to set, for example, a usage fee based on the number of training data used in the training process of the generated AI model, a usage fee based on the sales price of the generated AI model, a usage fee based on the profits obtained by the business operator from the business using the generated AI model, etc.
学習データ同一性管理部1233は、学習データの同一性チェック情報の生成処理及び同一性チェック処理を行う。例えば、所定のアルゴリズムに基づくハッシュ関数を用いて、学習データのハッシュ値を生成する。このハッシュ値は、学習データIDと紐付けて管理され、改ざんや編集されていない真正の学習データであることを確認(証明)するために利用される。学習データ同一性管理部1233は、例えば、モデル開発者からの同一性チェック要求があった場合、モデル開発者のユーザ端末から受信した学習データのハッシュ値を生成し、登録されたハッシュ値と比較して同一性チェック結果をモデル開発者に提供することができる。
The learning data
また、学習データ同一性管理部1233は、所定のアルゴリズムに基づくハッシュ関数を含む同一性チェック情報生成プログラムをモデル開発者のユーザ端末に提供することができる。モデル開発者は、提供された同一性チェック情報生成プログラムを学習データに対して実行してハッシュ値を生成する。モデル開発者は、ユーザ端末から生成したハッシュ値を管理装置100に送信する。学習データ同一性管理部1233は、受信したハッシュ値と登録されたハッシュ値と比較し、同一性チェック処理を行い、結果をユーザ端末に提供する。
The training data
この学習データ同一性チェック機能は、学習データが権利管理システムに登録された学習データであるか否かを判定する機能であり、モデル開発者が、学習データの真正を確認する意味と、権利管理システム以外の場所から得た学習データが、権利管理システムに登録された学習データであるかをモデル開発者が確認するために利用する意味とがある。モデル開発者は、生成AIモデルを生成する準備として、学習データの登録有無を事前に確認することができる。モデル開発者は、権利管理システム以外から得た学習データが、登録済み学習データある場合は、権利管理システムに対して利用許諾申請を行うことができる。 This learning data identity check function is a function that determines whether the learning data is learning data registered in the rights management system, and is used by the model developer to confirm the authenticity of the learning data, as well as to confirm whether learning data obtained from a source other than the rights management system is learning data registered in the rights management system. In preparation for generating a generative AI model, the model developer can check in advance whether the learning data is registered. If the learning data obtained from a source other than the rights management system is registered learning data, the model developer can apply for a license to use it from the rights management system.
学習データ利用許諾管理部1234は、権利管理システムに登録された学習データの利用許諾処理を行う。学習データ利用許諾管理部1234は、モデル開発者のユーザ端末からの登録された学習データに対する利用許諾申請を受け付けて、学習データID別に利用許諾処理を行う。
The learning data usage
学習データ管理部123は、学習データID、同一性チェック情報、学習データ提供者ID、権利情報ID、データセットの説明などを含む学習データ属性情報を、学習データ別に一元的に管理する。そして、学習データ管理部123は、利用許諾された学習データをモデル開発者のユーザ端末にダウンロード可能に制御することができる。
The learning
なお、上述したように、学習データは複数のデータで構成されたデータセットを含むケースがあるが、データセットはデータ容量が多いので管理装置100にアップロードすることが難しい場合がある。そこで、学習データ自体を管理装置100にアップロードせずに、学習データの登録情報のみを管理装置100に入力するように構成してもよい。
As mentioned above, the learning data may include a dataset made up of multiple data, but since the dataset has a large data volume, it may be difficult to upload it to the
具体的には、学習データ管理部123は、学習データ同一性管理部1233が管理する上述の同一性チェック情報生成プログラムを学習データ提供者のユーザ端末に提供可能に制御する。そして、学習データ提供者は、提供された同一性チェック情報生成プログラムを学習データに対して実行してハッシュ値を生成する。学習データ提供者は、生成したハッシュ値を管理装置100に送信する。学習データ登録制御部1231は、受信したハッシュ値に学習データIDを割り当てて登録し、学習データ属性情報を生成することができる。
Specifically, the learning
この場合、モデル開発者は、学習データを管理装置100以外の手段で取得することができる。例えば、学習データ提供者から直接、学習データを取得したり、学習データ提供者が利用するダウンロードサイトを介して取得したりすることができる。モデル開発者は、管理装置100以外のルートで学習データを取得した場合、管理装置100にアクセスし、学習データ同一性管理部1233が提供する同一性チェック機能を通じて、取得した学習データの同一性チェックを行い、学習データ利用許諾管理部1234が提供する利用許諾機能を通じて取得した学習データの利用許諾を申請することができる。
In this case, the model developer can obtain the training data by means other than the
モデル管理部124は、モデル登録制御部1241、モデル同一性管理部1242、モデル利用許諾管理部1243を含んで構成されている。
The
モデル登録制御部1241は、管理装置100に登録された学習データを用いて生成された生成AIモデル別にモデルIDを割り当て、使用された学習データの学習データIDとモデルIDとを紐付けたモデル登録情報を生成する。具体的には、モデル開発者は、権利管理システムに登録された学習データを使用して生成した生成AIモデルを、権利管理システムに登録する。モデル登録制御部1241は、生成AIモデル登録画面を通じてモデルプロパティ情報を受け付け、モデルIDを割り当てる。そして、生成AIモデルの登録に伴い、同一性チェック情報を生成するためのハッシュ関数を含む同一性チェック情報生成プログラムを、ユーザ端末に提供する。モデル開発者は、モデルプロパティ情報を含む生成AIモデルのソースデータを対象に同一性チェック情報生成プログラムを実行し、ハッシュ値を生成する。生成したハッシュ値を、モデルプロパティ情報と共に生成AIモデル登録画面を通じて入力する。
The model
モデル登録制御部1241は、モデルID、モデル開発者ID、モデルプロパティ情報、及び同一性チェック情報(ハッシュ値)を含むモデル登録情報を生成し、記憶装置130に記憶する。
The model
ここで、モデルプロパティ情報について説明する。モデルプロパティ情報は、生成AIモデルの学習処理に使用された学習データID及びデータ数を含み、学習データID及びデータ数以外にも、生成AIモデルの任意のプロパティ情報を含むように構成することができる。モデル登録制御部1241は、モデルプロパティ情報を含む生成AIモデルのソースデータを対象に生成された同一性チェック情報を含むモデル登録情報を生成するように構成することができる。このように生成AIモデルの同一性をチェックするハッシュ値に、使用された学習データID及びデータ数が含まれることで、同じ学習データIDを使用した生成AIモデルであってもデータ数が異なれば、異なるハッシュ値(個別のモデル登録情報)が生成される。権利管理システムは、生成AIモデルと学習データID及びそのデータ数とが不可分な状態で登録、管理する。
Here, the model property information will be described. The model property information includes the learning data ID and the number of pieces of data used in the learning process of the generating AI model, and can be configured to include any property information of the generating AI model in addition to the learning data ID and the number of pieces of data. The model
モデル同一性管理部1242は、学習データ管理部123の学習データ同一性管理部1233と同様の機能を提供する。つまり、生成AIモデルが権利管理システムに登録された生成AIモデルであるか否かを判定する機能を提供し、生成AIモデルを利用する事業者が、権利管理システムに登録された生成AIモデルであるかを確認するために利用する。事業者は、生成AIモデルを利用した事業を行う準備として、生成AIモデルの登録有無を事前に確認することができる。事業者は、使用する生成AIモデルが、登録済み生成AIモデルである場合は、権利管理システムに対して利用許諾申請を行う。
The model
モデル利用許諾管理部1243は、事業者に対して生成AIモデルの利用許諾処理を行う。モデル利用許諾管理部1243は、事業者のユーザ端末から登録された生成AIモデルに対する利用許諾申請を受け付けて、モデルIDと事業者と紐付ける利用許諾処理を行う。
The model
使用料管理部125は、事業情報受付部1251、使用料算出部1252、使用料支払管理部1253、使用料分配管理部1254を含んで構成されている。
The usage
事業情報受付部1251は、事業者のユーザ端末から利用許諾された生成AIモデルを使用した事業の収益関連情報を受け付ける機能を提供する。使用料算出部1252は、収益関連情報に基づいて、学習データに紐付く権利情報に応じた使用料を算出する。具体的には、権利情報に含まれる料率設定情報と、収益関連情報に含まれる生成AIモデルを使用した事業収益とに基づいて、事業者が支払う使用料を算出する。使用料支払管理部1253は、事業者が支払う使用料の請求処理を行う。請求処理は、使用料の支払いを事業者に求める処理である。なお、請求に伴うクレジット決済や口座振替などの決済処理を含むように構成してもよい。使用料分配管理部1254は、事業者から入金された使用料を集計して学習データ提供者別に分配金を算出する。使用料管理部125は、算出された分配金を、学習データ提供者の振込先に支払う処理を行う。
The business
記憶装置130は、ユーザ情報1301、学習データ1302、権利情報1303、学習データ属性情報1304、学習データ利用許諾情報1305、モデル登録情報1306、モデル利用許諾情報1307、事業情報1308、使用料課金情報1309、使用料分配情報1310を記憶する。
The storage device 130
図3は、権利管理システムにおける学習データ提供者を中心とした処理フローを示す図である。 Figure 3 shows the processing flow centered on the learning data provider in the rights management system.
図3に示すように、学習データ提供者は、管理装置100にアクセスし、ユーザ登録を行う(S301)。管理装置100は、学習データ提供者IDを割り当て、入力されたユーザ情報の登録処理を行う(S101)。学習データ提供者は、ユーザ端末を通じて学習データ提供者IDに基づいてログインを行い(S302)、管理装置100は、ログイン認証処理を行う(S102)。
As shown in FIG. 3, the learning data provider accesses the
ログイン認証後、学習データ提供者は、学習データの登録処理を行う(S303)。学習データ提供者は、ユーザ端末を通じて管理装置100に学習データのアップロードを行う。管理装置100は、アップロードされた学習データに対して、同一性チェック情報の生成処理を行う(S103)。管理装置100は、アップロードされた学習データに学習データIDを割り当て、学習データIDと同一性チェック情報とを紐付けて学習データを格納する(S104)。学習データのアップロードに伴い、学習データ提供者は、登録する学習データの権利情報を入力する(S304)。管理装置100は、入力された権利情報の登録処理を行い(S105)、入力された権利情報に権利情報IDを割り当て、学習データIDと紐付ける。学習データIDと紐付けられた権利情報を格納する(S106)。管理装置100は、学習データ登録処理及び権利情報登録処理を通じて、学習データ属性情報を生成し、記憶装置130に記憶する。
After login authentication, the learning data provider performs a registration process for the learning data (S303). The learning data provider uploads the learning data to the
図4は、権利管理システムにおけるモデル開発者を中心とした処理フローを示す図である。 Figure 4 shows the process flow centered on the model developer in the rights management system.
図4に示すように、モデル開発者は、管理装置100にアクセスし、ユーザ登録を行う(S401)。管理装置100は、モデル開発者IDを割り当て、入力されたユーザ情報の登録処理を行う(S111)。モデル開発者は、ユーザ端末を通じてモデル開発者IDに基づいてログインを行い(S402)、管理装置100は、ログイン認証処理を行う(S112)。
As shown in FIG. 4, the model developer accesses the
ログイン認証後、モデル開発者は、学習データの検索を行うことができる(S403)。管理装置100は、モデル開発者が指定する検索条件に基づいて検索処理を行い、検索結果をモデル開発者のユーザ端末に提供する(S113)。
After login authentication, the model developer can search for learning data (S403). The
管理装置100は、検索された学習データの権利情報を閲覧可能に制御し(S114)、モデル開発者は、ユーザ端末を通じて権利情報を確認する(S404)。
The
モデル開発者は、所望の学習データに対して利用許諾申請を行う(S405)。管理装置100は、利用許諾申請を受け付けて利用許諾処理を行い、申請された学習データとモデル開発者とを紐付ける(S115)。管理装置100は、利用許諾された学習データをダウンロード可能に制御し、モデル開発者からの学習データの取得要求に基づいて(S406)、学習データをモデル開発者のユーザ端末に提供する(S116)。
The model developer applies for a license to use the desired learning data (S405). The
モデル開発者は、管理装置100に登録された学習データを用いた生成AIモデルの開発・生成を行う(S407)。モデル開発者は、生成した生成AIモデルを管理装置100に登録する。このとき、モデル開発者は、生成した生成AIモデルのモデルプロパティ情報に、使用した学習データの学習データID及びデータ数を記録する。
The model developer develops and generates a generative AI model using the learning data registered in the management device 100 (S407). The model developer registers the generated generative AI model in the
モデル開発者は、管理装置100から同一性チェック情報生成プログラムを取得し(S409,S117)、学習データID及びデータ数が記録されたモデルプロパティ情報を含むソースデータを対象に同一性チェック情報生成プログラムをユーザ端末で実行して、同一性チェック情報を生成する(S410)。 The model developer acquires the identity check information generation program from the management device 100 (S409, S117), and executes the identity check information generation program on the user terminal for source data including model property information in which the learning data ID and the number of data are recorded, to generate identity check information (S410).
モデル開発者は、同一性チェック情報及びモデルプロパティ情報をモデル登録画面を通じて入力する(S411)。管理装置100は、モデルIDを割り当て、同一性チェック情報及びモデルプロパティ情報を含むモデル登録情報を生成し(S118)、保存する(S119)。
The model developer inputs identity check information and model property information through the model registration screen (S411). The
図5は、権利管理システムにおける事業者を中心とした処理フローを示す図である。 Figure 5 shows the process flow centered on the business operator in the rights management system.
図5に示すように、事業者は、管理装置100にアクセスし、ユーザ登録を行う(S501)。管理装置100は、事業者IDを割り当て、入力されたユーザ情報の登録処理を行う(S131)。事業者は、ユーザ端末を通じて事業者IDに基づいてログインを行い(S502)、管理装置100は、ログイン認証処理を行う(S132)。
As shown in FIG. 5, the business operator accesses the
ログイン認証後、事業者は、生成AIモデルの検索を行うことができる(S503)。管理装置100は、事業者が指定する検索条件に基づいて検索処理を行い、検索結果を事業者のユーザ端末に提供する(S133)。
After login authentication, the business operator can search for a generated AI model (S503). The
事業者は、所望の生成AIモデルに対して利用許諾申請を行う(S404)。管理装置100は、利用許諾申請を受け付け、生成AIモデルに紐付く学習データの権利情報に基づいて、使用料課金情報を生成する(S134)。管理装置100は、生成した使用料課金情報を事業者のユーザ端末に提供し、事業者は、ユーザ端末を通じて利用許諾に合意する意思表示を行う(S505)。管理装置100は、事業者の利用許諾の合意に基づいて、利用許諾処理を行い、申請された生成AIモデルと事業者とを紐付ける(S135)。
The business operator applies for a license to use the desired generated AI model (S404). The
使用料課金情報は、例えば、生成AIモデルに紐付く学習データの権利情報に基づいて生成される、事業者ID及びモデルID別の使用料の課金情報である。使用料課金情報は、事業者が登録した収益関連情報や、使用料の請求履歴、使用料の支払い履歴(入金履歴)を含むように構成することができる。 The usage fee billing information is, for example, usage fee billing information for each business operator ID and model ID, which is generated based on the rights information of the learning data linked to the generated AI model. The usage fee billing information can be configured to include revenue-related information registered by the business operator, usage fee billing history, and usage fee payment history (deposit history).
事業者は、登録された機械学習モデルを使用した事業を行い、使用料課金情報に関する収益関連情報を作成する(S506)。事業者は、作成した収益関連情報を管理装置100に登録(報告)する(S507)。 The business uses the registered machine learning model to conduct business and create revenue-related information related to usage fee billing information (S506). The business registers (reports) the created revenue-related information to the management device 100 (S507).
管理装置100は、使用料課金情報に基づいて、収益関連情報に応じた使用料を算出する(S136)。管理装置100は、算出された使用料の請求処理を行い(S137)、事業者は、請求内容を確認する(S508)。
The
事業者は、管理装置100(権利管理プラットフォーム)を運営する運営者を振込先として、請求された使用料の入金処理を行う(S509)。なお、上述のように、事業者による使用料の入金処理は、クレジットカード決済や口座振替などによる公知の手法を適宜適用してもよい。管理装置100は、事業者からの使用料の入金を確認し(S138)、入金履歴(支払い履歴)を生成し、使用料課金情報を更新する(S139)。
The business operator performs the payment process for the invoiced usage fee, with the operator who operates the management device 100 (rights management platform) as the payee (S509). As described above, the business operator may appropriately apply known methods such as credit card payment or account transfer to pay the usage fee. The
図6は、権利管理システムにおける学習データ提供者への分配処理フロー及び分配の仕組みを説明する図である。 Figure 6 is a diagram explaining the distribution process flow and distribution mechanism for training data providers in the rights management system.
図6に示すように、管理装置100は、一定の間隔で、使用料分配処理を行う(S151)。具体的には、管理装置100は、使用料課金情報(使用料課金ログ)を集計し(S152)、集計された使用料を生成AIモデルに使用された学習データID別に分配する(S153)。つまり、学習データID別に分配金を算出する。管理装置100は、算出された分配金を該当の学習データ提供者の振込先に支払う処理を行う(S154)。支払い処理完了後、学習データ提供者のユーザ端末に入金の通知を行う(S155)。
As shown in FIG. 6, the
管理装置100は、権利管理プラットフォームとして、学習データ提供者の学習データを識別化し、学習データを使用して生成された生成AIモデルと紐付けする。そして、実際に生成AIを使用した事業を行う事業者と生成AIモデルを紐付けすることで、事業者が生成AIモデルを使用して行った事業と学習データ提供者とを紐付けることができる。これにより、事業者の事業収益を学習データ提供者に分配するルートを形成することができる。
As a rights management platform, the
なお、図6に示すように、モデル開発者と事業者が同じの組織に属している場合もある。この場合、モデル開発者及び事業者としてそれぞれ個別にユーザ登録し、上述の学習データ利用許諾及びモデル利用許諾を経て、事業者と学習データ提供者が紐付くことになる。 As shown in Figure 6, the model developer and the business operator may belong to the same organization. In this case, the model developer and the business operator will each register as separate users, and the business operator and the training data provider will be linked after obtaining the training data usage license and model usage license described above.
本実施形態の権利管理システムは、生成AIを利用して新たなコンテンツやビジネスを生み出す際に、関係者同士を良好に繋ぐことができる権利管理プラットフォームを提供することができる。 The rights management system of this embodiment can provide a rights management platform that can effectively connect the parties involved when creating new content or business using generative AI.
権利管理プラットフォームを通じて、学習データ提供者、モデル開発者、及び生成AIモデルを使用した事業を行う事業者を一元的に管理することができ、事業収益をもたらす生成AIモデルに寄与した学習データに対し、学習データ提供者への利益分配を行うことができる。 Through the rights management platform, training data providers, model developers, and businesses that use generative AI models can be managed in a centralized manner, and profits can be distributed to training data providers for the training data that contributes to generative AI models that generate business revenue.
以上、実施形態について説明したが、権利管理システムは、生成AIモデルに限らず、上述した第1の機械学習モデルにおいても同様に適用可能である。つまり、生成AIモデルが生成した新たなコンテンツや新たなデータによる事業収益だけでなく、従来の画像認識AIモデルや音声認識AIモデルなどの機械学習モデルが行う予測や判断の結果による事業収益に対し、当該機械学習モデルに学習データが寄与することがある。したがって、機械学習モデルが新たなコンテンツや新たなデータを生成するのか否かに関わらず、学習データに対して権利を有する者を保護することができる。 Although the embodiment has been described above, the rights management system is not limited to generative AI models, but can also be applied to the first machine learning model described above. In other words, the training data may contribute to the machine learning model not only to business revenue from new content or new data generated by the generative AI model, but also to business revenue from the results of predictions and judgments made by machine learning models such as conventional image recognition AI models and voice recognition AI models. Therefore, regardless of whether the machine learning model generates new content or new data, it is possible to protect those who have rights to the training data.
また、権利管理システムを構成する各機能は、1つのコンピュータ装置で実現したり、複数のコンピュータ装置に分散して実現したりすることができる。また、学習データを格納し、モデル開発者のユーザ端末に学習データを提供可能な記憶領域は、本権利管理システムとは分離して設ける構成であってもよい。例えば、データ格納及びダウンロードを行うデータサービスを提供する外部記憶装置と連携し、権利管理システムを構築してもよい。 Furthermore, each function constituting the rights management system can be realized by one computer device, or distributed across multiple computer devices. Furthermore, the memory area that stores the learning data and can provide the learning data to the model developer's user terminal may be configured to be provided separately from this rights management system. For example, the rights management system may be constructed in cooperation with an external storage device that provides a data service for storing and downloading data.
また、学習データ同一性管理部1233とモデル同一性管理部1242は、1つの同一性管理部として構成し、学習データ及び生成AIモデルを含む機械学習モデルの双方に対して同一性チェック情報の生成機能、同一性チェック情報生成プログラムの提供、登録済みの同一性チェック情報との照合の各機能を提供するように構成してもよい。
In addition, the training data
また、権利管理システムを構成する各機能は、プログラムによって実現可能であり、各機能を実現するために予め用意されたコンピュータプログラムが補助記憶装置に格納され、CPU等の制御部が補助記憶装置に格納されたプログラムを主記憶装置に読み出し、主記憶装置に読み出された該プログラムを制御部が実行することで、各部の機能を動作させることができる。 In addition, each function that constitutes the rights management system can be realized by a program, and computer programs prepared in advance to realize each function are stored in an auxiliary storage device. A control unit such as a CPU reads the program stored in the auxiliary storage device into a main storage device, and the control unit executes the program read into the main storage device, thereby operating the functions of each unit.
また、上記プログラムは、コンピュータ読取可能な記録媒体に記録された状態で、コンピュータに提供することも可能である。コンピュータ読取可能な記録媒体としては、CD-ROM、Blu-ray(登録商標) Disc Rewritable等の光ディスク、DVD-ROM等の相変化型光ディスク、MO(Magneto Optical)等の光磁気ディスク、フロッピー(登録商標)ディスクやハードディスクなどの磁気ディスク、SDメモリカード、USBフラッシュドライブ等のメモリカードが挙げられる。また、本発明の目的のために特別に設計されて構成された集積回路(ROMやRAMなどのICチップ等)等のハードウェア装置も記録媒体として含まれる。
更に、上記プログラムを含めて本発明は、ノイマン型コンピュータのアーキテクチャ上で実行されることに限定されず、脳神経回路の仕組みをもとにしたニューロコンピュータや量子力学を情報処理に応用した量子コンピュータなどいわゆる非ノイマン型コンピュータのアーキテクチャ上で実行されてもよい。
The above program can also be provided to a computer in a state in which it is recorded on a computer-readable recording medium. Examples of computer-readable recording media include optical disks such as CD-ROMs and Blu-ray (registered trademark) Disc Rewritable, phase-change optical disks such as DVD-ROMs, magneto-optical disks such as MO (Magneto Optical), magnetic disks such as floppy (registered trademark) disks and hard disks, and memory cards such as SD memory cards and USB flash drives. Also included as recording media are hardware devices such as integrated circuits (IC chips such as ROM and RAM) that are specially designed and configured for the purpose of the present invention.
Furthermore, the present invention, including the above-mentioned program, is not limited to being executed on the architecture of a von Neumann-type computer, but may be executed on the architecture of a so-called non-von Neumann-type computer, such as a neurocomputer based on the mechanism of neural circuits in the brain or a quantum computer that applies quantum mechanics to information processing.
なお、本発明の実施形態を説明したが、当該実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although an embodiment of the present invention has been described, this embodiment is presented as an example and is not intended to limit the scope of the invention. This new embodiment can be embodied in various other forms, and various omissions, substitutions, and modifications can be made without departing from the gist of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are included in the scope of the invention and its equivalents described in the claims.
100 管理装置
110 通信装置
120 制御装置
121 ユーザインターフェース制御部
122 ユーザ管理部
1221 登録制御部
123 学習データ管理部
1231 学習データ登録制御部
1232 学習データ権利情報管理部
1233 学習データ同一性管理部
1234 学習データ利用許諾管理部
124 モデル管理部
1241 モデル登録制御部
1242 モデル同一性管理部
1243 モデル利用許諾管理部
125 使用料管理部
1251 事業情報受付部
1252 使用料算出部
1253 使用料支払管理部
1254 使用料分配管理部
130 記憶装置
1301 ユーザ情報
1302 学習データ
1303 権利情報
1304 学習データ属性情報
1305 学習データ利用許諾情報
1306 モデル登録情報
1307 モデル利用許諾情報
1308 事業情報
1309 使用料課金情報
1310 使用料分配情報
100 Management device 110 Communication device 120
Claims (12)
学習データ提供者の学習データに学習データIDを割り当て、学習データIDが割り当てられる学習データの権利情報の登録を受け付けるとともに、学習データに対する利用許諾申請をモデル開発者から受け付ける学習データ管理部と、
利用許諾された学習データを用いて生成された生成AIモデルの登録を受け付け、使用された学習データの学習データIDと紐付くモデル登録情報を生成するとともに、登録された生成AIモデルに対する利用許諾申請を事業者から受け付けるモデル管理部と、
生成AIモデルによって生成されたコンテンツ又はデータを通じて事業収益を得る事業者に対し、利用許諾された生成AIモデルに紐付く学習データの権利情報に応じた使用料を算出し、事業者から入金された使用料を集計して学習データ提供者別に分配金を算出する使用料管理部と、
を有することを特徴とする権利管理システム。 A rights management system for learning data used in a generative AI model that generates new content or new data,
a learning data management unit that assigns a learning data ID to the learning data of the learning data provider, receives registration of rights information for the learning data to which the learning data ID is assigned, and receives a license application for the learning data from the model developer;
a model management unit that accepts registration of a generative AI model generated using the licensed learning data, generates model registration information linked to the learning data ID of the used learning data, and accepts a license application for the registered generative AI model from a business operator;
a usage fee management unit that calculates usage fees according to the rights information of the learning data linked to the licensed generating AI model for businesses that earn business revenue through the content or data generated by the generating AI model, and that aggregates the usage fees paid by the businesses to calculate distribution amounts for each learning data provider;
13. A rights management system comprising:
学習データ提供者の端末からアップロードされた学習データに学習データIDを割り当てて所定の記憶領域に登録する学習データ登録制御部と、
学習データ提供者の端末を通じた権利情報の入力制御を行うとともに、入力された権利情報を学習データIDと関連付けて所定の記憶領域に登録する学習データ権利情報管理部と、
モデル開発者の端末からの登録された学習データに対する利用許諾申請を受け付けて、学習データID別に利用許諾処理を行う学習データ利用許諾管理部と、を有し、
前記学習データ管理部は、利用許諾された学習データをモデル開発者の端末にダウンロード可能に制御することを特徴とする請求項1に記載の権利管理システム。 The learning data management unit
a learning data registration control unit that assigns a learning data ID to the learning data uploaded from the terminal of the learning data provider and registers the learning data in a predetermined storage area;
a learning data right information management unit that controls input of right information through a terminal of a learning data provider and registers the input right information in a predetermined storage area in association with a learning data ID;
a learning data license management unit that accepts a license application for the registered learning data from a model developer's terminal and performs a license process for each learning data ID;
The rights management system according to claim 1 , wherein the learning data management unit controls the learning data that has been permitted for use so that the learning data can be downloaded to a terminal of a model developer.
アップロードされた学習データを対象に、所定のアルゴリズムで構成されたハッシュ関数に基づく同一性チェック情報生成プログラムを実行して同一性チェック情報を生成する学習データ同一性管理部を備え、
前記学習データ登録制御部は、学習データIDと同一性チェック情報とを紐付けて学習データを登録することを特徴とする請求項2に記載の権利管理システム。 The learning data management unit
a learning data identity management unit that executes an identity check information generation program based on a hash function configured by a predetermined algorithm for the uploaded learning data to generate identity check information;
3. The rights management system according to claim 2, wherein the learning data registration control unit registers the learning data by linking the learning data ID with identity check information.
所定のアルゴリズムで構成されたハッシュ関数に基づく同一性チェック情報生成プログラムを、学習データ提供者の端末に提供する学習データ同一性管理部と、
学習データを対象に同一性チェック情報生成プログラムを実行して生成された同一性チェック情報を学習データ提供者の端末から受け付け、学習データIDを割り当てて所定の記憶領域に登録する学習データ登録制御部と、
学習データ提供者の端末を通じた権利情報の入力制御を行うとともに、入力された権利情報を学習データIDと関連付けて所定の記憶領域に登録する学習データ権利情報管理部と、
モデル開発者の端末からの登録された学習データに対する利用許諾申請を受け付けて、学習データID別に利用許諾処理を行う学習データ利用許諾管理部と、を有することを特徴とする請求項1に記載の権利管理システム。 The learning data management unit
a training data identity management unit that provides a training data provider's terminal with an identity check information generation program based on a hash function configured with a predetermined algorithm;
a learning data registration control unit that receives identity check information generated by executing an identity check information generation program on the learning data from a terminal of a learning data provider, assigns a learning data ID to the identity check information, and registers the identity check information in a predetermined storage area;
a learning data right information management unit that controls input of right information through a terminal of a learning data provider and registers the input right information in a predetermined storage area in association with a learning data ID;
The rights management system according to claim 1, further comprising a learning data license management unit that accepts a license application for registered learning data from a model developer's terminal and performs license processing for each learning data ID.
学習データを用いて生成された生成AIモデル別にモデルIDを割り当て、使用された学習データの学習データIDとモデルIDを含むモデル登録情報を生成するモデル登録制御部と、
事業者の端末からの登録された生成AIモデルに対する利用許諾申請を受け付けて、モデルID別に利用許諾処理を行うモデル利用許諾管理部と、
を有することを特徴とする請求項1又は2に記載の権利管理システム。 The model management unit
A model registration control unit that assigns a model ID to each generated AI model generated using the learning data and generates model registration information including the learning data ID and the model ID of the used learning data;
A model license management unit that accepts a license application for the registered generated AI model from the business operator's terminal and performs license processing for each model ID;
3. The rights management system according to claim 1, further comprising:
所定のアルゴリズムで構成されたハッシュ関数に基づく同一性チェック情報生成プログラムを、モデル開発者の端末に提供するモデル同一性管理部をさらに備え、
前記モデル登録制御部は、生成AIモデルのソースデータを対象に同一性チェック情報生成プログラムを実行して生成された同一性チェック情報をモデル開発者の端末から受け付け、学習データID、モデルID及び同一性チェック情報を含むモデル登録情報を生成することを特徴とする請求項6に記載の権利管理システム。 The model management unit
A model identity management unit is further provided for providing an identity check information generation program based on a hash function configured by a predetermined algorithm to a terminal of a model developer,
The rights management system described in claim 6, characterized in that the model registration control unit receives identity check information generated by executing an identity check information generation program targeting source data of a generated AI model from a model developer's terminal, and generates model registration information including a learning data ID, a model ID, and identity check information.
前記モデル登録制御部は、モデルプロパティ情報を含む生成AIモデルのソースデータを対象に生成された同一性チェック情報をモデル開発者の端末から受け付け、モデル登録情報を生成することを特徴とする請求項7に記載の権利管理システム。 The generated AI model holds model property information including the learning data ID and the number of pieces of learning data used,
The rights management system described in claim 7, characterized in that the model registration control unit accepts identity check information generated for source data of a generated AI model including model property information from a model developer's terminal, and generates model registration information.
利用許諾された生成AIモデルによって生成されたコンテンツ又はデータを通じて得た事業収益に関連する収益関連情報を事業者の端末から受け付ける事業情報受付部と、
収益関連情報に基づいて、許諾された生成AIモデルに紐付く学習データの権利情報に応じた使用料を算出する使用料算出部と、
事業者が支払う使用料の請求処理を行う使用料支払管理部と、
事業者から入金された使用料を集計して学習データ提供者別に分配金を算出し、学習データ提供者の振込先に分配金を支払う使用料分配管理部と、
を有することを特徴とする請求項1に記載の権利管理システム。 The fee management unit
A business information receiving unit that receives revenue-related information related to business revenue obtained through content or data generated by the licensed generation AI model from a business operator's terminal;
A fee calculation unit that calculates a fee according to the rights information of the learning data associated with the licensed generated AI model based on the revenue-related information;
a fee payment management unit that processes billing for fees paid by businesses;
a fee distribution management unit that aggregates the fees received from the businesses, calculates distributions for each learning data provider, and pays the distributions to the bank accounts of the learning data providers;
2. The rights management system of claim 1, further comprising:
学習データ提供者の学習データに学習データIDを割り当て、学習データIDが割り当てられる学習データの権利情報の登録を受け付けるとともに、学習データに対する利用許諾申請をモデル開発者から受け付ける第1機能と、
利用許諾された学習データを用いて生成された生成AIモデルの登録を受け付け、使用された学習データの学習データIDと紐付くモデル登録情報を生成するとともに、登録された生成AIモデルに対する利用許諾申請を事業者から受け付ける第2機能と、
生成AIモデルによって生成されたコンテンツ又はデータを通じて事業収益を得る事業者に対し、利用許諾された生成AIモデルに紐付く学習データの権利情報に応じた使用料を算出し、事業者から入金された使用料を集計して学習データ提供者別に分配金を算出する第3機能と、
を実現させるプログラム。 A program executed by a computer that performs rights management of learning data used in a generative AI model that generates new content or new data,
a first function of assigning a learning data ID to the learning data of the learning data provider, accepting registration of rights information for the learning data to which the learning data ID is assigned, and accepting an application for permission to use the learning data from the model developer;
A second function of accepting registration of a generative AI model generated using the licensed learning data, generating model registration information linked to the learning data ID of the used learning data, and accepting a license application for the registered generative AI model from the business operator;
A third function of calculating a usage fee according to the rights information of the learning data linked to the licensed generating AI model for a business operator who obtains business revenue through the content or data generated by the generating AI model, aggregating the usage fees paid by the business operator, and calculating distributions for each learning data provider;
A program to achieve this.
学習データ提供者の学習データに学習データIDを割り当て、学習データIDが割り当てられる学習データの権利情報の登録を受け付けるとともに、学習データに対する利用許諾申請をモデル開発者から受け付ける学習データ管理部と、
利用許諾された学習データを用いて生成された機械学習モデルの登録を受け付け、使用された学習データの学習データIDと紐付くモデル登録情報を生成するとともに、登録された機械学習モデルに対する利用許諾申請を事業者から受け付けるモデル管理部と、
利用許諾された機械学習モデルに紐付く学習データの権利情報に応じて事業者が支払う使用料を算出し、事業者から入金された使用料を集計して学習データ提供者別に分配金を算出する使用料管理部と、
を有することを特徴とする権利管理システム。
A system for managing rights to learning data, comprising:
a learning data management unit that assigns a learning data ID to the learning data of the learning data provider, receives registration of rights information for the learning data to which the learning data ID is assigned, and receives a license application for the learning data from the model developer;
a model management unit that accepts registration of a machine learning model generated using the licensed learning data, generates model registration information linked to a learning data ID of the used learning data, and accepts a license application for the registered machine learning model from a business operator;
a fee management unit that calculates fees to be paid by businesses according to the rights information of the training data linked to the licensed machine learning model, and that aggregates the fees received from the businesses to calculate distributions to each training data provider;
13. A rights management system comprising:
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023222279A JP2025104457A (en) | 2023-12-28 | 2023-12-28 | Learning data rights management system |
| PCT/JP2024/044319 WO2025142572A1 (en) | 2023-12-28 | 2024-12-13 | Rights management system for learning data |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023222279A JP2025104457A (en) | 2023-12-28 | 2023-12-28 | Learning data rights management system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2025104457A true JP2025104457A (en) | 2025-07-10 |
Family
ID=96218944
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023222279A Pending JP2025104457A (en) | 2023-12-28 | 2023-12-28 | Learning data rights management system |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP2025104457A (en) |
| WO (1) | WO2025142572A1 (en) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7309533B2 (en) * | 2019-09-06 | 2023-07-18 | 株式会社日立製作所 | Model improvement support system |
-
2023
- 2023-12-28 JP JP2023222279A patent/JP2025104457A/en active Pending
-
2024
- 2024-12-13 WO PCT/JP2024/044319 patent/WO2025142572A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| WO2025142572A1 (en) | 2025-07-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20220391887A1 (en) | Systems and Methods for Maintenance of NFT Assets | |
| US20220229883A1 (en) | System and method for protecting, managing and monetizing creative works using blockchain | |
| US11886398B2 (en) | Data supply chain | |
| US7206765B2 (en) | System and method for supplying and managing usage rights based on rules | |
| US8069116B2 (en) | System and method for supplying and managing usage rights associated with an item repository | |
| CN113508412A (en) | Feedback communication protocol based on casting and destruction block chains | |
| US20040039704A1 (en) | System and method for supplying and managing usage rights of users and suppliers of items | |
| US11699202B2 (en) | Method and system to facilitate gamified arbitration of smart contracts | |
| WO2019213779A1 (en) | Blockchain data exchange network and methods and systems for submitting data to and transacting data on such a network | |
| JPWO2019004118A1 (en) | Content contract in block chain and content management system and content using the same | |
| Menges et al. | DEALER: decentralized incentives for threat intelligence reporting and exchange | |
| JP2014139818A (en) | System and method for supplying and managing right display | |
| US20090094147A1 (en) | Multi-Computer Data Transfer and Processing to Support Electronic Content Clearance and Licensing | |
| CN100359514C (en) | System, method, and device for content distribution fee distribution | |
| KR20140018229A (en) | Rights clearance for granular rights | |
| Anthony Jr | Decentralized brokered enabled ecosystem for data marketplace in smart cities towards a data sharing economy | |
| US20240362601A1 (en) | Method, electronic device and system for managing online digital assets | |
| JP2025104457A (en) | Learning data rights management system | |
| KR102020316B1 (en) | System and method for managing outsourcing contents to pay production cost reasonably | |
| JP2023173232A (en) | Trust program used in digital content trust platform | |
| KR100891492B1 (en) | Content direct transaction system between members | |
| Krishnamachari et al. | Iot marketplace: A data and api market for iot devices | |
| TWI897219B (en) | Method for distributing rights and interests of digital works, computer device and computer-readable storage medium | |
| WO2021106507A1 (en) | Program, and information processing method | |
| Bachmann et al. | Deti: A decentralized ticketing management platform |