JP5965267B2 - Information processing apparatus and information processing method - Google Patents
Information processing apparatus and information processing method Download PDFInfo
- Publication number
- JP5965267B2 JP5965267B2 JP2012213919A JP2012213919A JP5965267B2 JP 5965267 B2 JP5965267 B2 JP 5965267B2 JP 2012213919 A JP2012213919 A JP 2012213919A JP 2012213919 A JP2012213919 A JP 2012213919A JP 5965267 B2 JP5965267 B2 JP 5965267B2
- Authority
- JP
- Japan
- Prior art keywords
- representative value
- frequency distribution
- distribution
- region
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 25
- 238000003672 processing method Methods 0.000 title description 3
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 238000000034 method Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005192 partition Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000000151 deposition Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理技術に関し、異なる領域の度数分布に基づいて度数を推定するための情報処理技術に関し、例えば、地域情報から移住者の特徴を推定する分析活動を支援するための情報を作成する技術に関するものである。 The present invention relates to information processing technology, and relates to information processing technology for estimating frequency based on frequency distribution of different areas, for example, creating information for supporting analysis activities for estimating migrants' characteristics from regional information It is related to the technology.
度数分布表は、学術的、実用的に広く用いられている。
例えば、企業の営業活動において顧客との取引関係を深め、顧客ロイヤルティを高めるために、地域情報から地域の持つ独自性、異質性を見極めることを目的として各地域の特徴をつかむ分析作業が求められている。このため、地域別に集計した人口統計や金融関連情報、消費購買力情報から地域の特徴をつかむ上で有用な情報を抽出する分析技術が求められている。
The frequency distribution table is widely used academically and practically.
For example, in order to deepen business relationships with customers and increase customer loyalty in corporate sales activities, analysis work that grasps the characteristics of each region for the purpose of determining the uniqueness and heterogeneity of the region from regional information is required. It has been. For this reason, there is a need for an analysis technique that extracts information useful for grasping regional characteristics from demographics, financial information, and consumer purchasing power information that are tabulated by region.
従来から、地域の情報を利用した営業活動支援を目的とした分析手法は存在している。例えば、下記特許文献1では商品の購入者が居住する地域の情報にもとづいて販売実績情報を分析することにより、商品の販売者にとって有用な情報を生成するものである。
Conventionally, there is an analysis method aiming at sales activity support using local information. For example, in
ところで、一般的に地域情報をもとに分析を行う際には地域の細分化を行う必要がある。これは、市場を細分化して小さく見ることでその細やかな変化に目を凝らし、その地域のニーズを見出すためである。このため、地域情報をもとに分析を行う際には都道府県・市区町村といった大きな括りではなく、町丁別といった小さな単位にまで細分化することが有効である。 By the way, in general, when performing analysis based on regional information, it is necessary to subdivide the region. This is to find out the needs of the region by focusing on the subtle changes by segmenting the market into smaller ones. For this reason, when performing analysis based on regional information, it is effective to subdivide into small units such as towns and villages rather than large groups such as prefectures and municipalities.
しかしながら、地域情報を収集したデータベースには市区町村単位までしか詳細な情報がなく、町丁別単位では詳細な情報が欠落している状態のものがある。 However, there is a database in which regional information is collected that contains detailed information only up to the municipality unit, and detailed information is missing in the town-by-town unit.
このため、地域情報の分析が市区町村といった上位区画地域単位のみで行われ、町丁別といった下位区画地域単位の市場の変化を見出すことができず適切な判断・改善行動をとることができない状態になってしまう。 For this reason, regional information is analyzed only in the upper-level area units such as municipalities, and changes in the market in the lower-level area units such as town-by-town cannot be found and appropriate judgment and improvement actions cannot be taken. It becomes a state.
それ以外にも、実験などにより求められた特性を階調として、各階調毎の度数を求めて度数分布とした際に、異なる測定領域間で度数分布のデータを補間できれば、有用である。 In addition, it is useful if the frequency distribution data can be interpolated between different measurement areas when the frequency obtained by experiments is used as the gray level and the frequency for each gray level is obtained to obtain the frequency distribution.
本発明は、大きな領域とそれとは異なる小さな領域等との間の度数分布の関連を求め、度数分布を補間する情報処理を行うことを目的とする。 An object of the present invention is to perform an information process for interpolating the frequency distribution by obtaining the relationship of the frequency distribution between a large area and a small area different from the large area.
本発明の一観点によれば、第1の領域における第1の度数分布の第1の代表値と、前記第1領域とは異なる第2の領域の第2の度数分布の第2の代表値とを比較する代表値比較部と、前記代表値比較部において、第1の代表値と第2の代表値との一致度が低い場合に、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換部と、前記分布変換部で変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較部で比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるまで前記第2の代表値を求める処理を継続する分布推定部とを有することを特徴とする情報処理装置が提供される。 According to an aspect of the present invention, the first representative value of the first frequency distribution in the first region and the second representative value of the second frequency distribution in the second region different from the first region. In the representative value comparison unit and the representative value comparison unit, the first frequency distribution and the second frequency distribution when the degree of coincidence between the first representative value and the second representative value is low. And a new second representative value based on the second frequency distribution converted by the distribution conversion unit and a distribution conversion unit that converts the second frequency distribution in a direction that reduces the distribution bias The new second representative value is compared with the first representative value by the representative value comparison unit, and the degree of coincidence between the first representative value and the new second representative value is high. There is provided an information processing apparatus comprising: a distribution estimation unit that continues the process of obtaining the second representative value until
前記分布推定部で推定された第2の代表値と度数分布とに基づいて、前記第2の度数分布の度数を算出する度数分布算出部を有することを特徴とする。 It has a frequency distribution calculation unit that calculates the frequency of the second frequency distribution based on the second representative value and the frequency distribution estimated by the distribution estimation unit.
また、本発明は、地域情報データベースを備えた情報処理装置であって、前記地域情報データベースに予め格納されている上位区画の地域とその下位区画にあたる地域の2つの平均値の比較処理を行う比較部と、その比較結果をもとに上位区画の地域の度数分布から下位区画の地域の度数分布に近づける変換方法を求める変換部と、前記変換方法を用いて上位区画の地域の度数分布から下位区画の度数分布を推定する処理を行う推定部と、推定した度数分布から母集団の平均値を求めるためのブートストラップ処理を行うブートストラップ処理部と、を備えることを特徴とする情報処理装置である。これにより、下位区画の地域の度数分布の推定を精度良く行うことができる。 In addition, the present invention is an information processing apparatus provided with a regional information database, which compares two average values of a region in a higher section and a region in a lower section that are stored in advance in the region information database. And a conversion unit for obtaining a conversion method for approximating the frequency distribution of the upper section region to the frequency distribution of the lower section region based on the comparison result, and the lower order from the frequency distribution of the upper section region using the conversion method An information processing apparatus comprising: an estimation unit that performs processing for estimating a frequency distribution of a partition; and a bootstrap processing unit that performs bootstrap processing for obtaining an average value of a population from the estimated frequency distribution is there. Thereby, it is possible to accurately estimate the frequency distribution of the area of the lower section.
本発明の他の観点によれば、第1の領域における第1の度数分布の第1の代表値と、前記第1領域とは異なる第2の領域の第2の度数分布の第2の代表値とを比較する代表値比較ステップと、前記代表値比較ステップにおいて、第1の代表値と第2の代表値との一致度が低い場合には、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換ステップと、前記分布変換ステップで変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較部で比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるまで前記第2の代表値を求める処理を継続する分布推定ステップと、を有することを特徴とする情報処理方法が提供される。 According to another aspect of the present invention, the first representative value of the first frequency distribution in the first region and the second representative of the second frequency distribution in the second region different from the first region. In the representative value comparison step for comparing values and the representative value comparison step, when the degree of coincidence between the first representative value and the second representative value is low, the first frequency distribution and the second value distribution A distribution conversion step of converting the second frequency distribution in a direction to reduce the deviation of the distribution from the frequency distribution, and a new second frequency distribution based on the converted second frequency distribution converted by the distribution conversion step. A representative value is obtained, the new second representative value and the first representative value are compared by the representative value comparison unit, and the degree of coincidence between the first representative value and the new second representative value And a distribution estimation step of continuing the process of obtaining the second representative value until the value becomes high. The information processing method according to symptoms is provided.
本発明は、上記に記載の情報処理方法をコンピュータに実行させるためのプログラムであっても良く、当該プログラムを記録するコンピュータ読み取り可能な記録媒体であっても良い。 The present invention may be a program for causing a computer to execute the information processing method described above, or a computer-readable recording medium for recording the program.
本発明によれば、次のような効果がある。
異なる領域の属性値情報に欠落情報部分が存在しても、一方の度数分布、属性平均値、他方の属性平均値をもとに欠落情報部分を推定して利用者に提供することで、特徴分析を推定することができる。
The present invention has the following effects.
Even if missing information parts exist in attribute value information in different areas, the missing information part is estimated based on one frequency distribution, attribute average value, and other attribute average value, and provided to the user. Analysis can be estimated.
以下、本発明の実施の形態による情報処理技術について図面に参照しながら詳細に説明する。
図1は、本発明の一実施の形態による情報処理装置を含むシステム構成図である。本実施の形態による情報システムは、地域情報などの特性(ある特性値がどの程度の度数存在するか)に関する度数分布(確率分布)情報データベース、ここでは例として図4で後述するように地域情報データベース11を備えたパーソナルコンピュータなどのホストシステム13を設け、このホストシステム13と利用者との情報のやり取りを行うパーソナルコンピュータやスマートフォンなどの情報入出力装置12が接続されている。ホストシステム13には、地域情報データベースなどの度数分布情報データベースに格納された第1の領域、例えば上位区画の地域と第2の領域、例えばその下位区画の地域の2つの平均値などの代表値(平均値、中央値など)の比較処理を行う代表値比較部131と、第1の領域(第1群)である上位区画の地域の度数分布から第2の領域で(第2群)ある下位区画の地域の度数分布を推定するための分布変更値、例えば変換式を算出する分布変更値算出部(変換式算出部)132を設け、変換式などを用いて第1の領域である上位区画の地域の度数分布を変換処理し第2の領域である下位区画の地域の度数分布の推定を行う分布変換部(変換処理部)133を備え、推定された第2の領域である下位区画の地域の度数分布から第2の領域である下位区画の地域全体の平均値を算出するための分布推定処理(ブートストラップ処理)を行う分布推定部(ブートストラップ処理部)134を設け、推定された第2の領域である下位区画の地域の度数分布から第2の領域である下位区画の地域の不明な属性値などの度数分布を算出する度数分布(不明値)算出部135を備えている。
Hereinafter, an information processing technique according to an embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a system configuration diagram including an information processing apparatus according to an embodiment of the present invention. The information system according to the present embodiment is a frequency distribution (probability distribution) information database relating to characteristics of regional information and the like (how much frequency a certain characteristic value exists), here as an example, as described later in FIG. A
図2は、本実施の形態による情報処理に用いられる度数分布の一例を示す図である。図2(a)は、1群の度数分布表であり、階級とそれに属する度数との関係と、合計度数と、代表値(ここでは平均値)とが示されている。図2(b)は、2群の度数分布表であり、階級とそれに属する度数との関係と、合計度数と、代表値(ここでは平均値)とが示されている。一例としては、図8に示すように、1群(図8(a))は、例えば、半導体基板(1ウエハ)上に多数形成されたLEDであり、階級が発光波長帯であり、度数が半導体基板上のその発光波長帯を有するLEDの個数である。2群(図8(b))は、例えば、半導体基板上に多数形成されたLEDのうちある領域(例えば中央の領域)であり、階級が発光波長帯であり、度数が半導体基板上の中央の領域の発光波長帯を有するLEDの個数である。階級と度数とは、度数分布を作成可能なあらゆる特性等に適用することができる。 FIG. 2 is a diagram illustrating an example of a frequency distribution used for information processing according to the present embodiment. FIG. 2A is a frequency distribution table of one group, and shows the relationship between the class and the frequency belonging to it, the total frequency, and the representative value (here, the average value). FIG. 2B is a frequency distribution table of two groups, showing the relationship between the class and the frequency belonging thereto, the total frequency, and the representative value (here, the average value). As an example, as shown in FIG. 8, one group (FIG. 8A) is, for example, a large number of LEDs formed on a semiconductor substrate (one wafer), the class is the emission wavelength band, and the frequency is The number of LEDs having the emission wavelength band on the semiconductor substrate. The second group (FIG. 8B) is, for example, a certain region (for example, the central region) of the LEDs formed on the semiconductor substrate, the class is the emission wavelength band, and the frequency is the center on the semiconductor substrate. This is the number of LEDs having a light emission wavelength band in the region. The class and the frequency can be applied to all characteristics that can create a frequency distribution.
図3は、本実施の形態による情報処理の流れを示すフローチャート図である。まず、図2(a)、図2(b)に示すデータのうち、2群のy1’からy4’までのデータが未知であり、合計度数と代表値(平均値)は既知であるとする。これらのデータが、度数分布情報データベース11内に格納されているとする。
FIG. 3 is a flowchart showing a flow of information processing according to the present embodiment. First, of the data shown in FIG. 2A and FIG. 2B, the data from y1 ′ to y4 ′ of the two groups is unknown, and the total frequency and the representative value (average value) are known. . It is assumed that these data are stored in the frequency
図3に示すように、処理が開始されると(ステップS1)、ステップS2で、1群の度数分布g(a)と1群2群の代表値E(a)、E(b)とを度数分布情報データベース11から取得してホストシステム13に入力する。ステップS3で、代表値比較部131が、E(a)、E(b)を比較し、E(a)が(b)とほぼ等しい場合には(ステップS3でYES)、度数分布(不明値)算出部135が、ステップS4で、第1群の度数分布を第2群の度数分布にそのまま適用することで、第2群の欠落情報を推定し、処理を終了する(ステップS6)。ステップS3でNoの場合には、ステップS7に進み、代表値比較部131が、E(a)>E(b)であるか否かを判定する。YESの場合には、ステップS8に進み、分布変換部133が、分布変更値算出部132が算出した変更値により、第2群の度数分布を低諧調側に変換する。そして、ステップS9において、変換した度数分布を基に代表値E’(a)を求める。ステップS7でNoの場合には、ステップS10に進み、第2群の度数分布を高諧調側に変換する。そして、ステップS9において、変換した度数分布を基に代表値E’(a)を求める。
As shown in FIG. 3, when the process is started (step S1), the frequency distribution g (a) of the first group and the representative values E (a) and E (b) of the first group and the second group are obtained in step S2. Obtained from the frequency
次いで、分布推定部134により処理が繰り返され、ステップS11において、E(a)をE’(a)、g(a)をg’(a)に置き換えて、ステップS3に戻る。ステップS3でE(a)が(b)とほぼ等しいと代表値比較部131が判定すると、ステップS4からステップS5に進み、度数分布算出部135が最終的な度数分布を求め、処理が終了する。
Next, the processing is repeated by the
以上のように、第1群の度数分布と、第1、第2群の代表値から、第2群の欠落情報、すなわち、y1’からy4’を精度よく推測することができる。図8で示した例では、平均値が330nmから360nmになるため、度数分布が1群から2群になると、長波長側に分布がずれる方向に変換される。 As described above, missing information of the second group, that is, y 1 ′ to y 4 ′ can be accurately estimated from the frequency distribution of the first group and the representative values of the first and second groups. In the example shown in FIG. 8, since the average value is changed from 330 nm to 360 nm, when the frequency distribution is changed from the first group to the second group, it is converted in a direction in which the distribution is shifted to the long wavelength side.
本実施の形態によれば、異なる領域の属性値情報に欠落情報部分が存在しても、一方の度数分布、属性平均値、他方の属性平均値をもとに欠落情報部分を推定して利用者に提供することで、特徴分析を推定することができる。 According to the present embodiment, even if a missing information part exists in attribute value information in different areas, the missing information part is estimated and used based on one frequency distribution, the attribute average value, and the other attribute average value. The feature analysis can be estimated.
次に、より具体的な例について説明する。図4(a)は、上位区画地域にあたるA県B市といった市区町村単位による預貯金額情報を集計したデータを示している。図4(b)は、A県B市の下位区画地域にあたるA県B市のC町といった町丁単位による預貯金額情報を集計したデータを示している。図4(b)における「―」は該当データがないこと、すなわち欠落情報があることを示しており、つまりA県B市C町といった下位の町丁単位では預貯金額別に該当人口数が集計されておらず、地域の人口合計数と預貯金額の平均値のみしか集計されていないことを示している。このように、下位区画地域において集計されていない情報部分を欠落情報として取り扱う。以下では、この図4(b)の欠落情報であるA県B市C町の預貯金額別の該当人口数の推定を目的とした処理手順について説明する。 Next, a more specific example will be described. FIG. 4 (a) shows data obtained by summing up deposit / saving amount information in units of municipalities such as A city and B city corresponding to the upper division area. FIG. 4 (b) shows data obtained by tabulating deposit and saving amount information in units of towns, such as C town of A prefecture B city, which is a subdivision area of A prefecture B city. “-” In FIG. 4 (b) indicates that there is no corresponding data, that is, there is missing information. In other words, the number of corresponding populations is counted by deposit and saving amount in the subordinate towns such as A city, B city and C town. It shows that only the total number of populations in the region and the average value of deposits and savings are counted. In this way, information portions that are not tabulated in the lower-partition area are handled as missing information. Below, the process procedure aiming at the estimation of the number of population according to the deposit and savings amount of A prefecture B city C town which is missing information of this FIG.4 (b) is demonstrated.
図5は、ホストシステム13における図4(b)の預貯金額別の該当人口数の推定を例とした処理の概要を示すフローチャート図である。ホストシステム13における処理の初期設定として、まずg(a)にA県B市単位で集計した預貯金額別の人口分布を、h(b)を推定の対象となるA県B市C町単位で集計した預貯金額別の人口分布として設定する(ステップ301)。次に、g(a)とh(b)の関係性を判断するためにA県B市の預貯金額の代表値の一例である平均値E(a)とA県B市C町の預貯金額の代表値の一例である平均値E(b)の比較を行う(ステップ302、ステップ303)。預貯金額の平均値の比較結果がE(a)≒E(b)の際には、A県B市とA県B市C町の預貯金額別の人口分布の形状がほぼ同じと判断してh(b)=g(a)と見なして次のステップ310に進む(ステップ304)。預貯金額の平均値の比較結果がE(a)>E(b)、E(a)<E(b)の際には、A県B市の預貯金額別人口分布g(a)を変換することでA県B市C町の預貯金額別人口分布h(b)の推定を行うために、変換式f(x)の生成を行う。変換式f(x)は、A県B市の預貯金額別人口分布g(a)とA県B市C町の預貯金額別人口分布h(b)の関係を示したものであり、h(b)=g(a)の際にはf(x)=xとなるものである。預貯金額の平均値の比較結果がE(a)>E(b)の際には、平均値が大きいA県B市の預貯金額別人口分布g(a)を全体的にマイナス側に移動させることで平均値を下げてE(a)をE(b)に近づける。
FIG. 5 is a flowchart showing an outline of processing in the
このため、A県B市の預貯金額別人口分布g(a)からA県B市C町の預貯金額別人口分布h(b)に変換処理で利用する変換式f(x)はf(x)=xに比べて上に凸となる。これをもとに、変換式f(x)を生成する(ステップ305)。預貯金額の平均値の比較結果がE(a)<E(b)の際には、平均値が小さいA県B市の預貯金額別人口分布g(a)を全体的にプラス側に移動させることで平均値を上げてE(a)をE(b)に近づける。このため、A県B市の預貯金額別人口分布g(a)からA県B市C町の預貯金額別人口分布h(b)に変換処理で利用する変換式f(x)はf(x)=xに比べて下に凸となる。これをもとに、変換式f(x)を生成する(ステップ306)。 For this reason, the conversion formula f (x) used in the conversion process from the population distribution g (a) by deposit and saving amount of A prefecture B city to the population distribution h (b) by deposit and saving amount of A prefecture B city C town is f (x ) = Protruded upward compared to x. Based on this, a conversion formula f (x) is generated (step 305). When the comparison result of the average value of deposits and savings is E (a) <E (b), the population distribution by depositing and savings amount g (a) of A city and B city with a small average value is moved to the plus side as a whole. As a result, the average value is raised and E (a) is brought close to E (b). For this reason, the conversion formula f (x) used in the conversion process from the population distribution g (a) by deposit and saving amount of A prefecture B city to the population distribution h (b) by deposit and saving amount of A prefecture B city C town is f (x ) = Lower than x. Based on this, a conversion formula f (x) is generated (step 306).
図6は、E(a)とE(b)の比較結果による変換式f(x)の違いを示したイメージ図である。上図(42)がE(a)>E(b)の際の上に凸の変換式f(x)のイメージであり、下図(43)がE(a)<E(b)の際の下に凸の変換式f(x)のイメージである。次に、生成した変換式f(x)を利用してA県B市の預貯金額別の人口分布g(a)をもとにしてA県B市C町の預貯金額別の推定人口分布g’(a)を求める(ステップ307)。次に、求めたg’(a)から母集団であるA県B市C町の預貯金額の平均値E’(a)を求めるためにブートストラップ法を利用する(ステップ308)。次に、A県B市C町の預貯金額別の推定人口分布g’(a)をg(a)に、A県B市C町の預貯金額の平均値E’(a)をE(a)に置き換え、再び数値比較部を通して実際のA県B市C町の預貯金額の平均値E(a)を比較することで評価を行う(ステップ302)。以上の処理を繰り返して、E(a)≒E(b)を導きA県B市C町の預貯金額別の人口分布h(b)の推定が終了したら(ステップ302でYES)、ステップ304を介してA県B市C町の預貯金額別の人口分布h(b)の推定を行うことでA県B市C町の預貯金額別人口の欠落情報部分の推定を行い(ステップ310)、処理を終了する。
FIG. 6 is an image diagram showing the difference in the conversion formula f (x) based on the comparison result between E (a) and E (b). The upper diagram (42) is an image of the conversion equation f (x) convex upward when E (a)> E (b), and the lower diagram (43) is when E (a) <E (b). It is an image of the conversion formula f (x) convex downward. Next, using the generated conversion formula f (x), based on the population distribution g (a) according to the deposit and saving amount of A prefecture B city, the estimated population distribution g according to the deposit and saving amount of A prefecture B city C town '(A) is obtained (step 307). Next, the bootstrap method is used to determine the average value E ′ (a) of the deposit amount of the B city, C city, A prefecture, which is the population from the determined g ′ (a) (step 308). Next, the estimated population distribution g ′ (a) of the A prefecture B city C town by deposit and saving amount is g (a), and the average value E ′ (a) of the deposit amount of A prefecture B city C town is E (a). Then, the evaluation is performed again by comparing the average value E (a) of the deposit and saving amounts of the A city, B city, and C town through the numerical value comparison unit (step 302). When the above processing is repeated to derive E (a) ≈E (b) and the estimation of the population distribution h (b) for each deposit and saving amount in A city, B city and C town is completed (YES in step 302),
図7は、算出されたA県B市C町の預貯金額別の人口分布h(b)から欠落情報部分の推定を行う処理のイメージ図である。初めにA県B市C町の預貯金額別の人口分布h(b)51をもとにA県B市C町の預貯金額別に人口の推定比率52を求める。次に、A県B市C町の預貯金額別の人口推定比率52にA県B市C町の合計人口53を組合せることでA県B市C町の預貯金額別の推定人口54を算出する。この情報処理を通して、欠落情報であったA県B市C町の預貯金額別の該当人口数を推定して利用者に提供を行う。
FIG. 7 is an image diagram of a process of estimating the missing information portion from the calculated population distribution h (b) of the prefecture A city B city C town according to the deposit and saving amount. First, based on the population distribution h (b) 51 for each deposit and saving amount in A prefecture, B city and C town, an estimated
本実施の形態によれば、下位区画地域の属性値情報に欠落情報部分が存在しても、上位区画地域の度数分布、属性平均値、下位区画地域の属性平均値をもとに欠落情報部分を推定して利用者に提供することで、地域情報を利用してより詳細な地域の特徴分析を行うことが可能となる。 According to the present embodiment, even if the missing information part exists in the attribute value information of the lower partition area, the missing information part based on the frequency distribution of the upper partition area, the attribute average value, and the attribute average value of the lower partition area By estimating and providing to the user, it is possible to perform more detailed regional feature analysis using regional information.
尚、上記の実施の形態において、添付図面に図示されている構成等については、これらに限定されるものではなく、本発明の効果を発揮する範囲内で適宜変更することが可能である。その他、本発明の目的の範囲を逸脱しない限りにおいて適宜変更して実施することが可能である。また、本発明の各構成要素は、任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれるものである。 In the above-described embodiment, the configuration and the like illustrated in the accompanying drawings are not limited to these, and can be changed as appropriate within the scope of the effects of the present invention. In addition, various modifications can be made without departing from the scope of the object of the present invention. Each component of the present invention can be arbitrarily selected, and an invention having a selected configuration is also included in the present invention.
本発明は、情報処理装置として利用可能である。 The present invention can be used as an information processing apparatus.
11…地域情報データベース
12…入出力装置
13…ホストシステム
131…代表値比較部
132…変換式算出部
133…変換処理部
134…ブートストラップ処理部
135…不明値算出部
21…A県B市の預貯金情報データ例
22…A県B市C町の預貯金情報データ例
41…f(x)=xの図
42…f(x)=xを上に凸にした図
43…f(x)=xを下に凸にした図
51…算出したA県B市C町の預貯金額別の人口分布
52…A県B市C町の預貯金額別人口推定比率
53…A県B市C町の合計人口
54…A県B市C町の預貯金額別の推定人口
11 ...
Claims (4)
前記代表値比較部において、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換部と、
前記分布変換部で変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較部で比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるように前記第2の代表値を求める処理を継続する分布推定部と
を有することを特徴とする情報処理装置。 A representative value comparison unit that compares the first representative value of the first frequency distribution in the first region with the second representative value of the second frequency distribution in the second region different from the first region. When,
In the representative value comparing unit, and a distribution converter for converting the pre-Symbol second frequency distribution in the direction of the small deviation of the distribution of the first frequency distribution and the second frequency distribution,
A new second representative value is obtained based on the converted second frequency distribution converted by the distribution conversion unit, and the new second representative value and the first representative value are obtained as the representative value. compared in comparison unit, having a distribution estimating unit to continue processing the first representative value and the degree of coincidence between the second representative value new said seek the second representative value higher due so An information processing apparatus characterized by the above.
前記地域情報データベースに予め格納されている上位区画の地域とその下位区画にあたる地域の2つの平均値の比較処理を行う比較部と、
その比較結果をもとに上位区画の地域の度数分布から下位区画の地域の度数分布に近づける変換方法を求める変換部と、
前記変換方法を用いて上位区画の地域の度数分布から下位区画の度数分布を推定する処理を行う推定部と、
推定した度数分布から母集団の平均値を求めるためのブートストラップ処理を行うブートストラップ処理部と、を備えることを特徴とする情報処理装置。 An information processing apparatus having a regional information database,
A comparison unit that performs a comparison process of two average values of a region in the upper section and a region in the lower section that are stored in advance in the region information database;
Based on the comparison result, a conversion unit for obtaining a conversion method that approximates the frequency distribution of the upper section area to the frequency distribution of the lower section area;
An estimation unit that performs processing for estimating the frequency distribution of the lower section from the frequency distribution of the upper section area using the conversion method;
An information processing apparatus comprising: a bootstrap processing unit that performs a bootstrap process for obtaining an average value of a population from an estimated frequency distribution.
前記代表値比較ステップにおいて、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換ステップと、
前記分布変換ステップで変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較ステップで比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるように前記第2の代表値を求める処理を継続する分布推定ステップと
を有することを特徴とする情報処理方法をコンピュータに実行させるためのプログラム。 A representative value comparison step of comparing the first representative value of the first frequency distribution in the first region with the second representative value of the second frequency distribution in the second region different from the first region. When,
In the representative value comparison step, the distribution converting step of converting the second frequency distribution before SL direction to reduce the deviation of the distribution of said first frequency distribution second frequency distribution,
A new second representative value is obtained based on the converted second frequency distribution converted in the distribution conversion step, and the new second representative value and the first representative value are used as the representative value. compared in comparison step, to have a distribution estimating step of continuing processing of said first representative value and the degree of coincidence between the second representative value new said seek the second representative value higher due so program for executing information processing how to computer characterized by.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012213919A JP5965267B2 (en) | 2012-09-27 | 2012-09-27 | Information processing apparatus and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012213919A JP5965267B2 (en) | 2012-09-27 | 2012-09-27 | Information processing apparatus and information processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014067361A JP2014067361A (en) | 2014-04-17 |
JP5965267B2 true JP5965267B2 (en) | 2016-08-03 |
Family
ID=50743658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012213919A Active JP5965267B2 (en) | 2012-09-27 | 2012-09-27 | Information processing apparatus and information processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5965267B2 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006084196A2 (en) * | 2005-02-04 | 2006-08-10 | Entelos, Inc. | Method for defining virtual patient populations |
JP2006323586A (en) * | 2005-05-18 | 2006-11-30 | Anabuki Construction Inc | Distribution table estimation system by housing ownership relationship |
-
2012
- 2012-09-27 JP JP2012213919A patent/JP5965267B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014067361A (en) | 2014-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11854022B2 (en) | Proactively predicting transaction dates based on sparse transaction data | |
US9058216B2 (en) | Method for estimating job run time | |
JP5784239B2 (en) | Data analysis method, data analysis apparatus, and storage medium storing processing program thereof | |
JP6825560B2 (en) | Sales activity support device and sales activity support method using cancellation forecast | |
US20120310939A1 (en) | Systems And Methods For Clustering Time Series Data Based On Forecast Distributions | |
JP6311851B2 (en) | Co-clustering system, method and program | |
WO2017159403A1 (en) | Prediction system, method, and program | |
US20160247173A1 (en) | Predicting customer lifetime value | |
US11049123B2 (en) | Methods for spatially relative apportionment of geospatial data in distributed computing systems, and related systems and apparatus | |
CN102819768A (en) | Method and system for analyzing passenger flow data | |
JP2017146888A (en) | Design support apparatus, method and program | |
JP6159056B2 (en) | Selection program, selection method and selection device | |
CN104156508A (en) | Solving method of mixed integer linear programming model | |
JP6085802B2 (en) | Method and system for identifying defective products based on user purchase behavior | |
JP5965267B2 (en) | Information processing apparatus and information processing method | |
CN115953182A (en) | Commodity promotion method, device, computer equipment and storage medium | |
CN110851502B (en) | Load characteristic scene classification method based on data mining technology | |
JPWO2019131608A1 (en) | Data processing equipment, data processing methods and programs | |
JP6729703B2 (en) | Information presenting method, device, and program | |
CN111353797B (en) | Resource allocation method and device and electronic equipment | |
EP4312167A1 (en) | Retail space planning through pattern recognition | |
JP2004287478A (en) | Method and apparatus for calculating predicted demand of goods and program therefor | |
CN118195671A (en) | Article sales predicting method and device, storage medium and electronic equipment | |
JP7243533B2 (en) | Information processing method and information processing device | |
WO2020175162A1 (en) | Demand prediction device, demand prediction method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150126 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20150225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5965267 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |