JP4448653B2 - Data analysis method - Google Patents
Data analysis method Download PDFInfo
- Publication number
- JP4448653B2 JP4448653B2 JP2002353833A JP2002353833A JP4448653B2 JP 4448653 B2 JP4448653 B2 JP 4448653B2 JP 2002353833 A JP2002353833 A JP 2002353833A JP 2002353833 A JP2002353833 A JP 2002353833A JP 4448653 B2 JP4448653 B2 JP 4448653B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- analysis
- dimensional
- distribution feature
- wafer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007405 data analysis Methods 0.000 title claims description 62
- 238000000034 method Methods 0.000 title claims description 44
- 238000009826 distribution Methods 0.000 claims description 82
- 238000004458 analytical method Methods 0.000 claims description 69
- 238000000605 extraction Methods 0.000 claims description 28
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000013075 data extraction Methods 0.000 claims description 14
- 238000007418 data mining Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 235000012431 wafers Nutrition 0.000 description 49
- 238000010586 diagram Methods 0.000 description 20
- 239000000284 extract Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
Images
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、広く産業界で取り扱われるデータ間の関連を把握し、産業上優位な結果をもたらすための有意性のある結果を抽出するデータ解析方法に関し、さらに、解析対象とするデータ値やその平均値だけに注目していては判別が困難である知識や情報を抽出するデータ解析方法に関する。
【0002】
特に、2次元のデータ解析を可能とし、たとえば、解析対象としてウェーハの面上に配置されたチップの特性値等のデータと、ウェーハ面上における各チップの2次元の配置位置によりデータ分布特徴量を得て解析対象の2次元のデータ解析を効率的におこなうデータ解析方法に関する。
【0003】
【従来の技術】
解析対象としてウェーハ上のチップの歩留り解析を例にとって説明する。特に、プロセスデータ解析のように、その解析結果から品質、生産性向上の対策決定のための参考データを得ようとする場合には、その精度、信頼度等が重要であり、これについては本願発明者等により既に出願されている(たとえば、下記特許文献1参照。ほか、特願2001−127534)。
【0004】
歩留り低下要因をできるだけ速やかに見つけて対策を実施するために、装置履歴、試験結果、設計情報、各種測定データ等から歩留りに効いている要因やその要因に効いている別の要因を見つけるためのデータ解析がおこなわれる。
【0005】
データ解析において、歩留り値のように解析対象となるものを目的変数、目的変数の要因となる装置履歴、試験結果、設計情報、各種測定データ等は説明変数といわれる。その際に各種統計学的手法が適用されるが、そのうちの一つとしてデータマイニングを適用することで、多種大量のデータから判別しにくい価値ある情報や規則性を抽出することができる。
【0006】
半導体デバイスの不良要因を解析するためには、収集されたデータをより多面的に科学的根拠に基づいて解析し、より多くの有意差を抽出するのが重要である。そのため、従来は計算機システムに蓄積されたオリジナルデータの値やその平均値がよく活用されている。しかし、複雑に絡み合ったオリジナルデータ群から不良要因等を抽出するのが困難な場合もある。そのような場合、ウェーハ面内チップやロット内ウェーハの各種測定結果や歩留り等に関して特徴的なデータ分布が存在すれば、それに基づいて不良データの解析を進めることができる。
【0007】
半導体デバイスの歩留りに関するデータ解析をおこなうには、歩留り値のように計算機システムに蓄積されているデータ値を用いる他に、これらのデータ値を編集した値、たとえば、ロット内ウェーハ歩留り値の分布特徴を活用することも有用である。本出願人は、ロット内データ分布特徴という1次元の特徴量を対象としてデータ解析をおこなう構成を出願している(特願2001−338185)。
【0008】
図9は、従来のデータ解析時に用いる表示画面を示す図である。従来、ウェーハ面内における2次元のデータ分布特徴の解析は、図示のような表示画面を用いておこなっていた。図示の例は、指定されたロット(複数ロットの指定も可能)のウェーハ面内における歩留りの分布状態をイメージ表示したものである。表示画面100の左側100aには、ウェーハWの面内を複数枠101に分割し、各枠101、すなわち、ウェーハWの同一位置にそれぞれ存在するチップの各歩留りが示されている。
【0009】
また、表示画面100の右側上部100bには、半導体製造プロセスの焼き付けショット時における2つのショット位置を例とした場合における歩留りがイメージおよび数値で表示されている。また、表示画面100の右側中央部100cには、ウェーハWの中心から所定幅ずつ同じ径方向に輪切り(計8領域)に分割したとき、各分割領域に属するチップの歩留りがイメージおよび数値で表示されている。また、表示画面100の右側下部100dには、ウェーハWを縦横および斜め方向(計8領域)に分割したとき、各分割領域に属するチップの歩留りがイメージおよび数値で表示されている。各イメージ内のマークは、大きいほど歩留りが高いことを示している。
【0010】
次に、図10は、特性試験で合格とされたチップのウェーハ面内分布を示す図である。図示において不良チップは空白で示されるが、この不良チップの発生状態は、ウェーハWの面内において一様に分布しているのではなく、特徴があることが示されている。
【0011】
そして、ウェーハ面内の同一位置に属するチップやウェーハ面内を前述した各分割パターンにしたがい、固定的に分割した各領域について、各領域に属するチップの属性値を集計し、解析者が上記表示画面を用いて視覚的に確認することができる。この他にもウェーハ面内のデータ分布特徴には、より多くの解析にとって有用な情報が存在している。
【0012】
【特許文献1】
特開2001−306999号公報
【0013】
【発明が解決しようとする課題】
しかしながら、実際にはデータ数値の不連続性や、複数の各領域にまたがる特徴が存在するなど、特に、ウェーハ面内における2次元の特徴量抽出となると、解析者がパターン認知する能力を有していても有効な情報を容易に認識することができなかった。加えて、このような2次元の特徴量を全ロットおよびウェーハについてすべて視覚的に確認する作業は膨大な作業量となった。
【0014】
したがって、図9に示したパターンを用いるだけに限らず、より汎用的なデータ分布の2次元特徴量を自動的に抽出する技術、および抽出されたデータ分布の2次元の特徴量を解析する方法が求められていた。また、従来、半導体の歩留りのデータ解析では、ウェーハ面内のデータ分布特徴、すなわち2次元の特徴量を用いた解析は、技術者の経験やノウハウが必要とされていた。
【0015】
この発明は、上記問題点に鑑みてなされたものであって、技術者の経験、ノウハウに依存する割合を減らし2次元のデータ分布特徴量を容易に定義、抽出でき、抽出されたデータ分布特徴量を用いてデータ解析を効率的におこなうことができるデータ解析方法を提供することを目的とする。
【0016】
【課題を解決するための手段】
上記目的を達成するため、本発明は、解析対象のデータ解析に必要なウェーハ上のチップ歩留まりデータをオリジナルデータの中から抽出するデータ抽出工程と、前記データ抽出工程により抽出されたウェーハ上のチップ歩留まりデータが解析対象の2次元座標上であらかじめ設定された複数の帰属領域のうちのどの帰属領域に該当するかを判定する帰属領域判定工程と、前記データ抽出工程によって抽出されたウェーハ上のチップ歩留まりデータを用いて前記帰属領域判定工程によって判定された帰属領域別に2次元のデータ分布特徴量を抽出する2次元データ分布特徴量抽出工程と、前記2次元データ分布特徴量抽出工程によって抽出された2次元のデータ分布特徴量を用いたデータの解析をおこなうデータ解析工程とを含み、前記2次元データ分布特徴量抽出工程は、前記2次元のデータ分布特徴量を、複数の前記帰属領域を2つの領域に2分割し、分割した2つの領域の代表値を用いた所定の算出式に基づき連続値として算出することで前記2次元のデータ分布特徴量を抽出することを特徴とする。
【0017】
この発明によれば、解析対象の2次元の特徴量抽出の対象の個々のデータがどの分割領域に属しているかを、個々のデータの2次元座標を抽出し、それが各領域分割パターン毎にどの領域に属するかを判定することにより、連続値として得ることができる。そして、2次元の座標上で特徴量が一様に分布していない場合等、この2次元のデータ分布の特徴量を容易に抽出でき、データ解析を効率的におこなえるようになる。
【0018】
【発明の実施の形態】
以下に添付図面を参照して、この発明にかかるデータ解析方法の好適な実施の形態を詳細に説明する。この実施の形態では、解析対象の具体例としてウェーハの面内における2次元のデータ分布特徴を抽出し、データ解析する例を説明する。
【0019】
図1は、本発明の実施の形態にかかるデータ解析方法の実施に供せられる計算機システムのハードウェア構成の一例を示す図である。この計算機システムは、図1に示すように、入力装置1、中央処理装置2、出力装置3および記憶装置4から構成される。
【0020】
図2は、図1に示す構成の計算機システムにより実現されるデータ解析装置の機能構成の一例を示すブロック図である。このデータ解析装置は、図2に示すように、複数のオリジナルデータを含むデータベース41からなるオリジナルデータ群42を有する。このデータベース41は、図1に示す計算機システムの記憶装置4において構築されている。
【0021】
また、データ解析装置は、オリジナルデータ群42の中に存在する1以上のデータの分布特徴を定量的に評価して抽出する(データ分布特徴の抽出)手段21、抽出した1以上のデータ分布特徴量の中から解析対象とする特徴量を選択する(解析対象特徴量の選択)手段22、解析対象に選択したデータ分布特徴量を目的変数として回帰木分析手法などによるデータマイニングをおこない、データ分布に潜む特徴や規則性などのルールファイル24を抽出する(データマイニング)手段23、抽出した特徴、規則性(ルールのファイル)24を用いてオリジナルデータの分布特徴を解析する統計解析コンポーネント25や図表作成コンポーネント26などの解析ツール群27を備える。
【0022】
以上の各手段21,22,23および解析ツール群27は、それぞれの処理をおこなうためのプログラムを中央処理装置2で実行することにより実現される。抽出されたルールファイル24は記憶装置4に記憶されるとともに、表示装置や印刷装置などの出力装置3により出力される。意思決定5は解析ツール群27による解析結果に基づいてなされる。
【0023】
また、上述したルールファイル24を抽出する手段23は、オリジナルデータ群42の中のオリジナルデータ、データ分布特徴の抽出手段21により抽出された2次元のデータ分布特徴、または解析ツール群27による解析結果に対してもデータマイニングをおこなうようになっている。また、解析ツール群27は、オリジナルデータ群42の中のオリジナルデータ、データ分布特徴の抽出手段21により抽出された2次元のデータ分布特徴、または解析ツール群27の出力結果に対しても解析をおこなうようになっている。また、解析ツール群27による解析結果は、解析対象特徴量の選択手段22やオリジナルデータ群42にフィードバックされる。また、オリジナルデータ群42には、データ分布特徴の抽出手段21の出力がフィードバックされる。
【0024】
ここでデータ分布特徴の抽出手段21における特徴量の抽出について説明する。前述したロット内のウェーハ歩留り値等の分布特徴は、1次元における特徴量であり、この1次元の特徴量は、このようなロット内のウェーハ歩留り、ウェーハの電気的特性値、あるいは時間変動する歩留り値や電気的特性値等から計算される。特徴量抽出の対象の個々のデータの属性値(ロット内のウェーハ番号、時刻等)を、特徴量抽出のための変数としてそのまま使用する。
【0025】
これに対し、この発明のデータ解析装置では、2次元の特徴量を抽出する。この2次元の特徴量は、ウェーハ内チップ、チップ群の歩留り、電気的特性値等から、各分割領域毎にまとめて計算される。このため、特徴量抽出の対象の個々のデータがどの分割領域に属しているかの判定が、個々の分割パターンにより必要となる。個々のデータの2次元座標を抽出し、それが各領域分割パターン毎にどの領域に属するかを判定する必要が生じる。
【0026】
図3は、2次元のデータ分布特徴の抽出手段21が抽出する分布特徴の定義を示す図である。分布特徴の対象は、ウェーハWを所定の分割方法で分割した際の各領域の属性値とする。そして、分割タイプは複数種類用意される。図3(a)に示す分割タイプは、ウェーハWの面内を中央と4方に計5分割した例である。図3(b)に示す分割タイプは、ウェーハWの面内を中心から8等分した例である。図3(c)に示す分割タイプは、ウェーハWの面内を中心から所定径毎に円形状(円環状)に3分割した例である。上記例に限らず、他にも不良要因を絞り込むのに適した分割タイプの追加および削除が可能である。
【0027】
後述するデータ解析処理では、各分割タイプそれぞれについて、どの2分割領域およびその組み合わせが他の領域や組み合わせに比べて対象とするデータ値についてどの程度の有意差が見いだせるかを判別するようになっている。
【0028】
次に、2次元のデータ分布特徴を数値化する手段について説明する。図3(a)に示した分割タイプを例に具体的に説明する。属性値の大小を考慮した計5つの領域(ZONE1〜ZONE5)の2分割方法の組み合わせは、30通り(= 5C1 +5C2 +5C3 +5C4 )となる。ここで、xiを各領域でのデータ値とし、全5領域を任意の2領域に分割する。図4は、複数領域を2分割した例を示す図である。図示の例では、2分割した領域の一方a(データ値がxh)をZONE1,2,3とし、他方b(データ値がxl)をZONE4,5とした場合である。
【0029】
ここで、
xi:全領域(ZONE1〜5)のxiの平均値
x1〜3 :一方の領域(xh:ZONE1,2,3)のxiの平均値
x4〜5 :他方の領域(xl:ZONE4,5)のxiの平均値
とすれば、図4に示す各分割領域xh,xlの平均値x1〜3 と、x4〜5 は、a,bを変数としてそれぞれ、下記式(1),(2)で表される。
【0030】
【数1】
【0031】
となる。ここで、2分割したa,bの領域について、(a−b)は、30の領域分割方法すべてについて得られるので、これを各分割方法についての特徴量として定量的に定義でき、(a−b)の値により、ウェーハWの面上における2次元のデータ分布特徴量が定義できる。ここで、特徴量としては、領域a,bそれぞれの代表値(たとえば、平均値,中央値,最小値,最大値,標準偏差等)を用い、上記のような領域a,bの差(a−b)、比(a:b)を用いることができる。また、いずれの場合でも上記数式等の演算により、値として連続値を得ることができる。
【0032】
以上の説明は、図3(a)に示した分割タイプについての2次元のデータ分布特徴量の算出に関するものであるが、図3(b)、(c)についても同様に上記式(1)、(2)で算出することができる。すなわち、領域の分割タイプが異なっても、差(a−b)の値は同様な意味を持つため、異なった領域の分割タイプにより得られた差(a−b)の値であっても特徴量としては同等に扱うことができる。したがって、各ウェーハWについて図3(a)〜(c)に示す領域の分割タイプ毎ではなく、総合的にみてどの領域の分割タイプのどの分割方法による特徴が最も顕著であるかを判別することが可能となる。
【0033】
上記a,bの領域の差(a−b)については、絶対値|a−b|の値が大きいほど、データ分布特徴が顕著に現れ、判別が容易になる。そして、図3(a)〜(c)に示す各領域の分割タイプ毎に得られた2次元の特徴量は、各レコード(ウェーハW)毎に定義される。
【0034】
図5は、各領域の分割タイプ毎に得られた特徴量を示す図である。これらの特徴量は、データ解析時の目的変数として扱われる。図示のように、各ウェーハW毎のn個のレコード1〜Nには、それぞれ分割タイプ毎のn個の特徴量01〜nが連続値で定義される。各特徴項目の特徴量はロット単位で求められる。図には、図3(a)〜(c)の各分割タイプについて、それぞれ異なる算出法による特徴量が格納される。たとえば、分割タイプa(図3(a)に相当)における特徴30とは、上述した属性値の大小まで考慮した計5つの領域(ZONE1〜ZONE5)に関する計30通りの2分割方法で得られた2次元の特徴量(連続値)である。
【0035】
次に、上記2次元の特徴量を目的変数とした回帰木分析について説明する。回帰木分析は、説明変数を同じにして抽出された各特徴量を順次目的変数に選択して、自動的に回帰木分析をおこない、それによって各特徴量を左右する要因がそれぞれについて抽出される。特に、何を解析すべきかが明確となっていない場合には、考えられるすべての特徴量を抽出し、それらを目的変数として回帰木分析を実行する。その結果、上述したように種々の解析結果が得られるので、その中で最も有意差が大とみなされる項目を歩留り改善のための対策項目の候補とする。このように従来の解析方法では容易に抽出されなかった多くの有意差が効率的に抽出される。
【0036】
ここで、回帰木分析および評価用統計値リストについて説明する。まず、回帰木分析について簡単に説明する。回帰木分析は、複数の属性を示す説明変数とそれにより影響を受ける目的変数からなるレコードの集合を対象とし、その目的変数に最も影響を与える属性と属性値を判別するものである。データマイニングをおこなってルールファイル24を抽出する手段23(回帰木分析エンジン)からはデータの特徴や規則性を示すルールが出力される。
【0037】
回帰木分析の処理は、各説明変数(属性)のパラメータ値(属性値)に基づいて集合の2分割を繰り返していくことで実現される。その集合分割の際、分割前の目的変数の平方和をS0、分割後の2つの集合のそれぞれの目的変数の平方和をS1およびS2としたとき、式(3)で示すΔSが最大となるように、分割するレコードの説明変数とそのパラメータ値を求める。
【0038】
ΔS=S0−(S1+S2) ・・・(3)
【0039】
ここで得られる説明変数とそのパラメータ値は、回帰木では分岐点に対応している。以降、分割された集合についても同様な処理を繰り返し、説明変数の目的変数に対する影響を調べる。以上が、一般によく知られている回帰木分析の手法であるが、集合分割の明確さをより詳しく把握するために、複数の上位分割候補に関して、ΔSの他に以下のパラメータ(a)〜(d)も回帰木分析結果の定量的な評価として使用する。これらのパラメータは評価用統計値リストとして出力される。
【0040】
(a)S比:
集合分割による平方和の低減率であり、集合分割により平方和がどの程度低減したかを示すパラメータである。この値が小さいほど集合分割の効果は大きく、集合分割が明確におこなわれているので、有意差が大である。
【0041】
S比=((S1+S2)/2)/S0 ・・・(4)
【0042】
(b)t値:
回帰木分析エンジンにより集合が2分割されるが、分割された2つの集合の平均(/X1,/X2)の差の検定のための値である。ここで、"/"は上線を示す。統計のt検定は、分割された集合における目的変数の平均値の有意差を示す基準となる。自由度、すなわちデータ数が同じであるなら、tが大きいほど集合が明確に分割されており、有意差が大である。
【0043】
この際、分割された集合の分散に有意差がない場合には次の(5)式によりt値を求め、分割された集合の分散に有意差がある場合には(6)式によりt値を求める。ここで、N1およびN2は、それぞれ分割した集合1および集合2の要素数である。また、/X1および/X2はそれぞれ分割後の各集合の平均である。S1およびS2は、それぞれ分割後の各集合の目的変数の平方和である。
【0044】
【数2】
【0045】
【数3】
【0046】
(c)分割された集合の目的変数の平均値の差:
この値が大きいほど有意差が大である。
【0047】
(d)分割された各集合のデータ数:
両者の差が小さいほど異常値(ノイズ)による影響が小である。
【0048】
そして、図5に示した特徴量が生じた要因をウェーハ検査時等の電気的特性値(たとえば電流値、電圧値、抵抗値)を説明変数として定義し回帰木分析を実行する。図6は、実際に回帰木分析を実行する際の入力データの一例を示す図である。図には、2次元のデータ分布特徴の抽出手段21により抽出されたデータ分布特徴量をCSV形式で出力した例が示されている。各特徴量は、レコード毎に独立して求められるので、独立して扱われる。たとえば、図6に示すように、各特徴量はCSV形式で自動的に出力されるので、各特徴量毎に効率的に有意な解析をおこなうことが可能となる。上記2次元の特徴量を抽出する処理をあらかじめプログラムに組み込んでおくか、あるいは抽出する特徴量を定義したファイルを用意して、そのファイルを読み込み実行することができる。
【0049】
いずれの特徴量も、ウェーハWの面内における2次元の分布であり、特徴量の値についても離散値ではなく、その特徴がどの程度の強さであるかという連続値で定義されている。値が連続値であるため、従来のように離散値化による情報の欠落が生じないので、より良好な解析結果が期待される。
【0050】
そして、目的変数とする2次元の特徴量が複数個01〜n(図5参照)あるとして、順次回帰木分析を実行する。n個の各特徴量は、それぞれ異なる分割方式(たとえば、図3参照)により得られた2次元の特徴量である。図7は、回帰木分析結果を示す図である。図には目的変数を図6に示す特徴02とし、説明変数を電流I1〜I9、電圧V1〜V5、抵抗R1、R2として回帰木分析をおこなった結果の例が示されている。図の上部には回帰木分析の結果を示す回帰木図が表され、図の下部にはこの回帰木分析の信頼度情報を表す評価用統計値リスト(Evaluation Data)が表されている。
【0051】
回帰木分析結果であるこの図7に基づいて、電流I7が0.67以下であるか否かが特徴02の値に最も影響を及ぼしていることが判明する。この図に示す評価用統計値リストには、説明変数を変えたときにある目的変数(特徴02)に最も影響を及ぼす順番が上下順に図表化して表示されている。
【0052】
この評価用統計値リストの第2行以下の項目S比,t値は、第1行目の項目のものに比べて大きく異なっていることから、電流I7の値の影響が際立っていることが判る。加えて、他の特徴量を目的変数とした回帰木分析結果については、評価用統計値リストの第1行目における項目のS比,t値は、第2行以下の項目のものに比べてさほど差があるものはみられなかった。第1候補のものと第2候補のものとでは、それほど差がない。これは、同じ程度の複数の要因があるため、不良対策を施しにくいことを示している。以上によって、仮に、値が特徴02よりも大きい特徴量(目的変数)が生じたとしても不良の発生要因が明確な特徴02(電流I7が0.67以下であるか否か)を不良対策として選定することが適切であると容易に判明できるようになる。
【0053】
図8は、本発明にかかるデータ解析方法の概略を示すフローチャートである。以上説明したように、このデータ解析方法が開始されると、まずオリジナルデータ群42の中から解析の対象とするデータ、たとえばウェーハWの歩留り値や各種測定値等のデータが選択されて抽出される(ステップS1)。つづいて、抽出された個々のデータの帰属領域が判定される(ステップS2)。この帰属領域の判定は、ウェーハW上における個々のデータの2次元座標を抽出し、各データの座標が図3に示した各領域分割パターン毎にどの領域に属するかを判定する。次に、抽出されたデータに対してウェーハWの面内における2次元のデータ分布特徴量を抽出する処理がおこなわれる(ステップS3)。
【0054】
そして、解析対象とするデータ分布特徴量が選択され、それを目的変数として回帰木分析等のデータマイニングがおこなわれる(ステップS4)。ステップS3で抽出されたすべてのデータ分布特徴量について回帰木分析がおこなわれ(ステップS5:No〜ステップS4のループ)、回帰木分析が終了したら(ステップS5:Yes)、分析結果が出力され、技術者はその確認をおこなう(ステップS6)。そして、技術者は、分析結果に基づいて意思決定をおこなう(ステップS7)。ステップS6、ステップS7は、図7に示す評価用統計値リストを用いてS比の値やtの値等を用いた上述の評価機能をコンピュータに自動実行させる構成とすることもできる。
【0055】
上述した実施の形態によれば、解析対象であるウェーハWのオリジナルデータ群内に存在するウェーハ面内の2次元のデータ分布特徴量を複数、定義および抽出し、これらを定量化する。そして、各データ分布特徴量を順次目的変数に選択して解析をおこなうことにより、不良解析等のデータ解析に有効な統計的有意差を抽出できるようになる。これにより、多種多様なデータであっても、埋もれて判別が困難であった関連性や有意差を、技術者の主観によらずに客観的に、また効率的および定量的に抽出することができるようになる。
【0056】
なお、上記実施の形態において説明した2次元のデータ分布特徴の抽出は、解析対象であるたとえばウェーハWを例にとると、最小単位で1枚のウェーハWに適用でき、1ロット単位あるいは複数ロットを単位とすることができ、オリジナルデータ群から規定した単位毎におこなうことができる。また、この発明は、3次元のデータ分布特徴の抽出についても容易に適用できるものである。
【0057】
以上説明したデータ解析方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、各種記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【0058】
(付記1)解析対象のデータ解析に必要なデータをオリジナルデータの中から抽出するデータ抽出工程と、
前記データ抽出工程により抽出されたデータが解析対象の2次元座標上であらかじめ設定された複数の帰属領域のうちのどの帰属領域に該当するかを判定する帰属領域判定工程と、
前記データ抽出工程によって抽出されたデータを用いて前記帰属領域判定工程によって判定された帰属領域別に2次元のデータ分布特徴量を抽出する2次元データ分布特徴量抽出工程と、
前記2次元データ分布量抽出工程によって抽出された2次元のデータ分布特徴量を用いたデータの解析をおこなうデータ解析工程と、
を含むことを特徴とするデータ解析方法。
【0059】
(付記2)前記2次元データ分布特徴量抽出工程は、
前記2次元のデータ分布特徴量を前記帰属領域を判定するための算出式に基づき連続値として算出することで前記2次元のデータ分布特徴量を抽出することを特徴とする付記1に記載のデータ解析方法。
【0060】
(付記3)前記解析対象毎のレコードを設定してファイル化し、各レコードに含まれる複数の前記2次元のデータ分布特徴量が互いに独立して設定されることを特徴とする付記1または2に記載のデータ解析方法。
【0061】
(付記4)前記データ解析工程は、
前記2次元のデータ分布特徴量を目的変数として、解析すべき2次元のデータの特徴や規則を表すルールをデータマイニングにより抽出することを特徴とする付記1〜3のいずれか一つに記載のデータ解析方法。
【0062】
(付記5)前記データ解析工程は、
前記抽出された2次元のデータ分布特徴量のうちいずれのデータ分布特徴量が最もデータ解析に有意な結果を与える目的変数であるかを前記データマイニングにより抽出することを特徴とする付記4に記載のデータ解析方法。
【0063】
(付記6)前記ルールの信頼度を表す情報として、前記データ解析工程により得たデータの集合を2分割する際の分割の明確度を表す集合分割評価値を求める評価工程を含むことを特徴とする付記4または5に記載のデータ解析方法。
【0064】
(付記7)前記評価工程は、
前記集合分割評価値として次の式で表されるS比の値を用いることを特徴とする付記6に記載のデータ解析方法。
S比=((S1+S2)/2)S0
ただし、S0は、複数のオリジナルデータよりなる集合を2分割する前の目的変数の平方和、S1およびS2はそれぞれ分割後の各集合の目的変数の平方和である。
【0065】
(付記8)前記評価工程は、
前記集合分割評価値として次の式で表されるtの値を用いることを特徴とする付記6に記載のデータ解析方法。
【数4】
【0066】
(付記9)前記評価工程は、
前記2分割した後の各分割集合に属する前記抽出されたデータの個数比を用いることを特徴とする付記6に記載のデータ解析方法。
【0067】
(付記10)前記評価工程は、
前記2分割を繰り返して得られた後の各分割集合が示す前記S比の値が小さく、かつ、tの値が大きい順に説明変数を附した評価用統計値リストを作成することを特徴とする付記6に記載のデータ解析方法。
【0068】
(付記11)解析対象の品質の変動を示す目的変数と、該目的変数の変動を説明する説明変数とを含むオリジナルデータのデータ解析をおこなうデータ解析プログラムであって、
前記解析対象のデータ解析に必要なデータをオリジナルデータの中から抽出させるデータ抽出工程と、
前記データ抽出工程によって抽出されたデータが前記解析対象の2次元座標上であらかじめ設定された複数の帰属領域のうちのどの帰属領域に該当するかを判定させる帰属領域判定工程と、
前記データ抽出工程によって抽出されたデータを用いて前記判定された帰属領域別に2次元のデータ分布特徴量を抽出させる2次元データ分布特徴量抽出工程と、
前記2次元データ分布特徴量抽出工程によって抽出された2次元のデータ分布特徴量を用いたデータの解析をおこなわせることを特徴とするデータ解析プログラム。
【0069】
(付記12)解析対象のデータ解析に必要なデータをオリジナルデータの中から抽出するデータ抽出手段と、
前記データ抽出手段により抽出されたデータが解析対象の2次元座標上であらかじめ設定された複数の帰属領域のうちのどの帰属領域に該当するかを判定する帰属領域判定手段と、
前記データ抽出手段によって抽出されたデータを用いて前記帰属領域判定手段によって判定された帰属領域別に2次元のデータ分布特徴量を抽出する2次元データ分布特徴量抽出手段と、
前記抽出された2次元のデータ分布特徴量を用いたデータの解析をおこなうデータ解析手段と、
を備えたことを特徴とするデータ解析装置。
【0070】
(付記13)前記データ解析手段により解析された2次元のデータの特徴や規則であるルールの信頼度を表す情報として、前記データ解析手段により得たデータの集合を2分割する際の分割の明確度を表す集合分割評価値を求める評価手段を備えたことを特徴とする付記12に記載のデータ解析装置。
【0071】
(付記14)前記解析対象は、半導体用ウェーハの面上に複数配置される各チップであり該各チップの特性値が前記オリジナルデータとして出力され、
前記帰属領域判定手段は、前記ウェーハの面上を複数の領域に分割し、該分割された複数の領域を任意の2領域のいずれかに含ませて前記帰属領域を判定することを特徴とする付記13に記載のデータ解析装置。
【0072】
(付記15)前記2次元データ分布特徴量抽出手段は、
前記任意の2領域にそれぞれ属する各データの代表値を特徴量とし、該2領域の総合値同士の差分、あるいは比を2次元のデータ分布特徴量とすることを特徴とする付記14に記載のデータ解析装置。
【0073】
【発明の効果】
本発明によれば、解析対象の2次元の特徴量抽出の対象の個々のデータがどの分割領域に属しているかを、個々のデータの2次元座標を抽出し、それが各領域分割パターン毎にどの領域に属するかを判定し、連続値として得ることができるため、技術者の経験、ノウハウに依存する割合を減らし2次元の特徴量を容易に定義、抽出でき、抽出された特徴量を用いて2次元の座標上でのデータ分布特徴を容易に抽出でき、データ解析を効率的におこなうことができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施の形態にかかるデータ解析方法の実施に供せられる計算機システムのハードウェア構成の一例を示す図である。
【図2】図1に示す構成の計算機システムにより実現されるデータ解析装置の機能構成の一例を示すブロック図である。
【図3】2次元のデータ分布特徴の抽出手段が抽出する分布特徴の定義を示す図である。
【図4】複数領域を2分割した例を示す図である。
【図5】各領域の分割タイプ毎に得られた特徴量を示す図である。
【図6】実際に回帰木分析を実行する際の入力データの一例を示す図である。
【図7】回帰木分析結果を示す図である。
【図8】本発明にかかるデータ解析方法の概略を示すフローチャートである。
【図9】従来のデータ解析時に用いる表示画面を示す図である。
【図10】特性試験で合格とされたチップのウェーハ面内分布を示す図である。
【符号の説明】
1 入力装置
2 中央処理装置
3 出力装置
4 記憶装置
21 データ分布特徴の抽出手段
22 解析対象特徴量の選択手段
23 データマイニング手段
24 特徴、規則性のルールファイル
25 統計解析コンポーネント
26 図表作成コンポーネント
27 解析ツール群
41 データベース
42 オリジナルデータ群[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a data analysis method for extracting a meaningful result for obtaining an industrially superior result by grasping a relation between data widely handled in the industry, and further, a data value to be analyzed and its value The present invention relates to a data analysis method for extracting knowledge and information that are difficult to discriminate by paying attention only to an average value.
[0002]
In particular, two-dimensional data analysis is possible. For example, the data distribution feature amount depends on the data such as the characteristic value of the chip arranged on the wafer surface as the analysis target and the two-dimensional arrangement position of each chip on the wafer surface. The present invention relates to a data analysis method for efficiently performing two-dimensional data analysis of an analysis target.
[0003]
[Prior art]
As an analysis target, description will be made by taking an example of yield analysis of chips on a wafer. In particular, when trying to obtain reference data for determining measures to improve quality and productivity from the analysis results, such as process data analysis, the accuracy, reliability, etc. are important. An application has already been filed by the inventors (see, for example,
[0004]
In order to find out the yield reduction factor as quickly as possible and take countermeasures, to find the factor that is effective in the yield and other factors that are effective in that factor from the device history, test results, design information, various measurement data, etc. Data analysis is performed.
[0005]
In data analysis, an analysis target such as a yield value is an objective variable, device history that causes the objective variable, test results, design information, various measurement data, and the like are called explanatory variables. Various statistical methods are applied at that time, and by applying data mining as one of them, it is possible to extract valuable information and regularity that are difficult to discriminate from a large amount of data.
[0006]
In order to analyze a failure factor of a semiconductor device, it is important to analyze the collected data on a multifaceted basis on a scientific basis and extract more significant differences. Therefore, conventionally, the value of the original data stored in the computer system and its average value are often used. However, there are cases where it is difficult to extract a failure factor or the like from a complicatedly intertwined original data group. In such a case, if there is a characteristic data distribution regarding various measurement results, yields, and the like of the chips in the wafer surface and the wafers in the lot, the analysis of the defect data can proceed.
[0007]
In order to perform data analysis on the yield of semiconductor devices, in addition to using the data values stored in the computer system, such as the yield values, values obtained by editing these data values, for example, distribution characteristics of wafer yield values in the lot It is also useful to utilize The present applicant has applied for a configuration for performing data analysis on a one-dimensional feature quantity called a data distribution feature in a lot (Japanese Patent Application No. 2001-338185).
[0008]
FIG. 9 is a diagram showing a display screen used in conventional data analysis. Conventionally, analysis of a two-dimensional data distribution feature in a wafer surface has been performed using a display screen as shown in the figure. In the example shown in the figure, the distribution state of the yield in the wafer surface of a designated lot (designation of a plurality of lots is also possible) is displayed as an image. On the
[0009]
Further, on the upper
[0010]
Next, FIG. 10 is a diagram showing the distribution in the wafer plane of the chips that have passed the characteristic test. In the drawing, defective chips are shown as blank, but the occurrence state of the defective chips is not uniformly distributed in the plane of the wafer W, but has a characteristic.
[0011]
Then, according to each division pattern described above for chips belonging to the same position on the wafer surface or within the wafer surface, the attribute values of the chips belonging to each region are totalized for each fixed division region, and the analyst displays the above It can be visually confirmed using a screen. In addition to this, information useful for more analysis exists in the data distribution characteristics in the wafer surface.
[0012]
[Patent Document 1]
JP 2001-306999 A
[0013]
[Problems to be solved by the invention]
However, in fact, there are discontinuities in the numerical values of the data, and there are features that span multiple areas. Especially, when extracting two-dimensional features in the wafer surface, the analyst has the ability to recognize patterns. However, effective information could not be easily recognized. In addition, the work of visually confirming such two-dimensional feature values for all lots and wafers is a huge amount of work.
[0014]
Therefore, not only using the pattern shown in FIG. 9, but also a technique for automatically extracting a two-dimensional feature value of a more general-purpose data distribution and a method of analyzing a two-dimensional feature value of the extracted data distribution Was demanded. Conventionally, in semiconductor yield data analysis, data distribution characteristics within the wafer surface, that is, analysis using two-dimensional feature values, requires experience and know-how of engineers.
[0015]
The present invention has been made in view of the above-described problems, and can reduce the proportion depending on the experience and know-how of engineers and easily define and extract two-dimensional data distribution feature amounts. An object of the present invention is to provide a data analysis method capable of efficiently performing data analysis using a quantity.
[0016]
[Means for Solving the Problems]
In order to achieve the above object, the present invention is necessary for analyzing data to be analyzed. Chip yield on wafer Data extraction process for extracting data from the original data, and extracted by the data extraction process Chip yield on wafer An attribution region determination step for determining which attribution region corresponds to data among a plurality of attribution regions set in advance on the two-dimensional coordinates to be analyzed, and the data extraction step Chip yield on wafer A two-dimensional data distribution feature amount extraction step for extracting a two-dimensional data distribution feature amount for each belonging region determined by the belonging region determination step using data, and 2 extracted by the two-dimensional data distribution feature amount extraction step A data analysis step of analyzing data using a two-dimensional data distribution feature amount, wherein the two-dimensional data distribution feature amount extraction step is configured to convert the two-dimensional data distribution feature amount into a plurality of attribution regions. The two-dimensional data distribution feature amount is extracted by dividing into two regions and calculating as continuous values based on a predetermined calculation formula using representative values of the two divided regions.
[0017]
According to the present invention, the two-dimensional coordinates of the individual data are extracted to determine which divided area the individual data of the two-dimensional feature extraction target to be analyzed belongs, and for each area division pattern. By determining which region it belongs to, it can be obtained as a continuous value. Then, when the feature amount is not uniformly distributed on the two-dimensional coordinates, the feature amount of the two-dimensional data distribution can be easily extracted, and data analysis can be performed efficiently.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Exemplary embodiments of a data analysis method according to the present invention will be explained below in detail with reference to the accompanying drawings. In this embodiment, an example in which a two-dimensional data distribution feature in the plane of a wafer is extracted and analyzed as a specific example of an analysis target will be described.
[0019]
FIG. 1 is a diagram illustrating an example of a hardware configuration of a computer system that is provided for carrying out a data analysis method according to an embodiment of the present invention. As shown in FIG. 1, the computer system includes an
[0020]
FIG. 2 is a block diagram showing an example of a functional configuration of the data analysis apparatus realized by the computer system having the configuration shown in FIG. As shown in FIG. 2, the data analyzing apparatus has an
[0021]
Further, the data analysis apparatus quantitatively evaluates and extracts the distribution feature of one or more data existing in the original data group 42 (extraction of data distribution feature) 21, and the extracted one or more data distribution features. Means 22 for selecting a feature quantity to be analyzed from the quantity (selection of analysis target feature quantity), data distribution feature quantity selected as the analysis target is used as a target variable, and data mining is performed by a regression tree analysis method, etc. (Data mining) means 23 for extracting a
[0022]
Each of the above means 21, 22, 23 and the
[0023]
The above-described means 23 for extracting the
[0024]
Here, extraction of feature amounts in the data distribution
[0025]
In contrast, the data analysis apparatus of the present invention extracts a two-dimensional feature amount. This two-dimensional feature amount is calculated for each divided region from the chip in the wafer, the yield of the chip group, the electrical characteristic value, and the like. For this reason, it is necessary to determine in which divided area each piece of data to be subjected to feature quantity extraction belongs to each divided pattern. It is necessary to extract two-dimensional coordinates of individual data and determine to which area each area division pattern belongs.
[0026]
FIG. 3 is a diagram showing the definition of distribution features extracted by the two-dimensional data distribution feature extraction means 21. The target of the distribution feature is an attribute value of each region when the wafer W is divided by a predetermined dividing method. A plurality of division types are prepared. The division type shown in FIG. 3A is an example in which the plane of the wafer W is divided into a total of five in the center and four directions. The division type shown in FIG. 3B is an example in which the plane of the wafer W is equally divided into eight from the center. The division type shown in FIG. 3C is an example in which the in-plane of the wafer W is divided into three circular shapes (annular shapes) from the center for each predetermined diameter. In addition to the above example, it is possible to add and delete division types suitable for narrowing down other failure factors.
[0027]
In the data analysis processing to be described later, for each division type, it is determined which two-divided region and its combination can find a significant difference in the target data value compared to other regions and combinations. Yes.
[0028]
Next, means for digitizing the two-dimensional data distribution feature will be described. A specific description will be given by taking the division type shown in FIG. There are 30 combinations of the two division methods for the total of five areas (ZONE1 to ZONE5) in consideration of the size of the attribute value (= Five C 1 + Five C 2 + Five C Three + Five C Four ) Here, xi is a data value in each area, and all 5 areas are divided into arbitrary 2 areas. FIG. 4 is a diagram illustrating an example in which a plurality of regions are divided into two. In the illustrated example, one of the two divided areas (data value xh) is ZONE1,2,3, and the other b (data value xl) is ZONE4,5.
[0029]
here,
xi: Average value of xi in all regions (ZONE1 to 5)
x 1 ~ Three : Average value of xi in one region (xh: ZONE1, 2, 3)
x Four ~ Five : The average value of xi in the other region (xl: ZONE4, 5)
Then, the average value x of the divided areas xh and xl shown in FIG. 1 ~ Three And x Four ~ Five Are expressed by the following formulas (1) and (2), respectively, with a and b as variables.
[0030]
[Expression 1]
[0031]
It becomes. Here, (a−b) is obtained for all of the 30 region dividing methods for the a and b regions divided into two, and this can be quantitatively defined as a feature value for each dividing method. The two-dimensional data distribution feature amount on the surface of the wafer W can be defined by the value of b). Here, as the feature quantity, representative values (for example, average value, median value, minimum value, maximum value, standard deviation, etc.) of the areas a and b are used, and the difference between the areas a and b (a -B), ratio (a: b) can be used. In any case, a continuous value can be obtained as a value by an operation such as the above mathematical formula.
[0032]
The above description relates to the calculation of the two-dimensional data distribution feature amount for the division type shown in FIG. 3A, but the above equation (1) is similarly applied to FIGS. 3B and 3C. , (2). That is, even if the division type of the region is different, the value of the difference (ab) has the same meaning. Therefore, even if the value of the difference (ab) obtained by the division type of the different region is used. The amount can be treated equally. Therefore, for each wafer W, it is not determined for each area division type shown in FIGS. 3A to 3C, but comprehensively determining which division method of which area division type is most remarkable. Is possible.
[0033]
As for the difference (ab) between the areas a and b, the larger the absolute value | a−b | And the two-dimensional feature-value obtained for every division | segmentation type of each area | region shown to Fig.3 (a)-(c) is defined for every record (wafer W).
[0034]
FIG. 5 is a diagram illustrating the feature amounts obtained for each division type of each region. These feature quantities are treated as objective variables at the time of data analysis. As illustrated, in the
[0035]
Next, regression tree analysis using the two-dimensional feature amount as an objective variable will be described. In the regression tree analysis, each feature quantity extracted with the same explanatory variable is selected as the target variable in order, and the regression tree analysis is automatically performed, thereby extracting the factors that influence each feature quantity. . In particular, if it is not clear what to analyze, all possible feature quantities are extracted, and regression tree analysis is performed using them as objective variables. As a result, various analysis results are obtained as described above, and an item that is regarded as having the largest significant difference among them is set as a candidate for a measure item for yield improvement. As described above, many significant differences that are not easily extracted by the conventional analysis method can be extracted efficiently.
[0036]
Here, the regression tree analysis and the statistical value list for evaluation will be described. First, the regression tree analysis will be briefly described. In the regression tree analysis, a set of records composed of explanatory variables indicating a plurality of attributes and objective variables affected thereby is determined, and attributes and attribute values that most affect the objective variables are discriminated. A rule indicating data characteristics and regularity is output from the means 23 (regression tree analysis engine) that performs data mining and extracts the
[0037]
The regression tree analysis process is realized by repeatedly dividing the set into two based on the parameter value (attribute value) of each explanatory variable (attribute). When the set is divided, if the sum of squares of the objective variables before the division is S0 and the sum of squares of the respective objective variables of the two sets after the division is S1 and S2, ΔS shown in the equation (3) becomes the maximum. As described above, the explanatory variable of the record to be divided and its parameter value are obtained.
[0038]
ΔS = S0− (S1 + S2) (3)
[0039]
The explanatory variables and parameter values obtained here correspond to branch points in the regression tree. Thereafter, the same processing is repeated for the divided sets, and the influence of the explanatory variable on the objective variable is examined. The above is a generally well-known method of regression tree analysis. In order to understand the clarity of set partitioning in more detail, in addition to ΔS, the following parameters (a) to ( d) is also used as a quantitative evaluation of the regression tree analysis results. These parameters are output as an evaluation statistical value list.
[0040]
(A) S ratio:
This is a reduction rate of the sum of squares by the set division, and is a parameter indicating how much the sum of squares has been reduced by the set division. The smaller this value is, the greater the effect of set partitioning is, and the set partition is clearly performed, so the significant difference is large.
[0041]
S ratio = ((S1 + S2) / 2) / S0 (4)
[0042]
(B) t value:
Although the set is divided into two by the regression tree analysis engine, it is a value for testing the difference between the averages (/ X1, / X2) of the two divided sets. Here, “/” indicates an overline. The statistical t-test is a standard indicating a significant difference in the mean value of the objective variable in the divided set. If the degree of freedom, that is, the number of data is the same, the larger the t, the more clearly the set is divided and the greater the difference.
[0043]
At this time, if there is no significant difference in the variance of the divided sets, the t value is obtained by the following equation (5). If there is a significant difference in the variance of the divided sets, the t value is obtained by the equation (6). Ask for. Here, N1 and N2 are the numbers of elements of
[0044]
[Expression 2]
[0045]
[Equation 3]
[0046]
(C) Difference in mean value of objective variables of divided sets:
The greater this value, the greater the difference.
[0047]
(D) Number of data in each divided set:
The smaller the difference between the two, the smaller the influence of abnormal values (noise).
[0048]
Then, the cause of the feature quantity shown in FIG. 5 is defined by defining electrical characteristic values (for example, current value, voltage value, resistance value) at the time of wafer inspection or the like as explanatory variables, and regression tree analysis is executed. FIG. 6 is a diagram illustrating an example of input data when the regression tree analysis is actually executed. The figure shows an example in which the data distribution feature amount extracted by the two-dimensional data distribution feature extraction means 21 is output in CSV format. Since each feature amount is obtained independently for each record, it is handled independently. For example, as shown in FIG. 6, since each feature amount is automatically output in the CSV format, significant analysis can be performed efficiently for each feature amount. The process of extracting the two-dimensional feature value can be incorporated in the program in advance, or a file defining the feature value to be extracted can be prepared and read and executed.
[0049]
Each feature amount is a two-dimensional distribution in the plane of the wafer W, and the feature value is not a discrete value but is defined by a continuous value indicating how strong the feature is. Since the values are continuous values, there is no loss of information due to discrete values as in the prior art, so a better analysis result is expected.
[0050]
Then, the regression tree analysis is sequentially performed on the assumption that there are a plurality of two-dimensional feature amounts 01 to n (see FIG. 5) as objective variables. Each of the n feature amounts is a two-dimensional feature amount obtained by a different division method (see, for example, FIG. 3). FIG. 7 is a diagram showing a regression tree analysis result. The figure shows an example of the result of regression tree analysis with the objective variable as the characteristic 02 shown in FIG. 6 and the explanatory variables as currents I1 to I9, voltages V1 to V5, and resistors R1 and R2. A regression tree diagram showing the results of the regression tree analysis is shown at the top of the diagram, and an evaluation statistical value list (Evaluation Data) representing the reliability information of the regression tree analysis is shown at the bottom of the diagram.
[0051]
Based on this regression tree analysis result shown in FIG. 7, it is found that whether or not the current I7 is 0.67 or less has the most influence on the value of the
[0052]
Since the item S ratio and t value in the second and lower rows of this statistical value list for evaluation are greatly different from those in the first row, the influence of the current I7 value may be conspicuous. I understand. In addition, for regression tree analysis results with other feature values as objective variables, the S ratio and t value of items in the first row of the statistical value list for evaluation are compared with those of items in the second and lower rows. There was no significant difference. There is not much difference between the first candidate and the second candidate. This indicates that it is difficult to take measures against defects because there are a plurality of factors of the same degree. As described above, even if a feature amount (objective variable) having a value larger than that of the
[0053]
FIG. 8 is a flowchart showing an outline of the data analysis method according to the present invention. As described above, when this data analysis method is started, data to be analyzed, for example, data such as yield values and various measurement values of the wafer W is first selected and extracted from the
[0054]
Then, a data distribution feature amount to be analyzed is selected, and data mining such as regression tree analysis is performed using it as an objective variable (step S4). Regression tree analysis is performed on all the data distribution features extracted in step S3 (step S5: No to step S4 loop), and when the regression tree analysis is completed (step S5: Yes), the analysis result is output, The engineer performs the confirmation (step S6). Then, the engineer makes a decision based on the analysis result (step S7). Steps S6 and S7 may be configured to cause the computer to automatically execute the above-described evaluation function using the S ratio value, the t value, and the like using the evaluation statistical value list shown in FIG.
[0055]
According to the above-described embodiment, a plurality of two-dimensional data distribution feature quantities in the wafer surface existing in the original data group of the wafer W to be analyzed are defined and extracted, and these are quantified. Then, by selecting and analyzing each data distribution feature amount as an objective variable sequentially, it becomes possible to extract a statistically significant difference effective for data analysis such as defect analysis. This makes it possible to objectively, efficiently, and quantitatively extract the relevance and significant differences that were buried and difficult to discriminate even with a wide variety of data, regardless of the subjectivity of the engineer. become able to.
[0056]
Note that the extraction of the two-dimensional data distribution feature described in the above embodiment can be applied to one wafer W in the minimum unit, for example, when the wafer W to be analyzed is taken as an example. Can be used for each unit defined from the original data group. The present invention can also be easily applied to extraction of three-dimensional data distribution features.
[0057]
The data analysis method described above can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on various recording media and executed by being read from the recording media by a computer. The program may be a transmission medium that can be distributed via a network such as the Internet.
[0058]
(Appendix 1) A data extraction process for extracting data necessary for analysis of data to be analyzed from original data;
An attribution region determination step for determining which attribution region among a plurality of attribution regions set in advance on the two-dimensional coordinates to be analyzed corresponds to the data extracted by the data extraction step;
A two-dimensional data distribution feature amount extraction step for extracting a two-dimensional data distribution feature amount for each attribution region determined by the attribution region determination step using the data extracted by the data extraction step;
A data analysis step for analyzing data using the two-dimensional data distribution feature amount extracted by the two-dimensional data distribution amount extraction step;
A data analysis method comprising:
[0059]
(Supplementary Note 2) The two-dimensional data distribution feature extraction step includes:
The data according to
[0060]
(Supplementary note 3) In
[0061]
(Appendix 4) The data analysis step
4. The rule according to any one of
[0062]
(Appendix 5) The data analysis step
The
[0063]
(Additional remark 6) It includes the evaluation process which calculates | requires the set division | segmentation evaluation value showing the division | segmentation clarity at the time of dividing the data set obtained by the said data analysis process into 2 as information showing the reliability of the said rule, It is characterized by the above-mentioned. The data analysis method according to
[0064]
(Supplementary note 7)
The data analysis method according to appendix 6, wherein an S ratio value represented by the following equation is used as the set partition evaluation value.
S ratio = ((S1 + S2) / 2) S0
However, S0 is the sum of squares of the objective variables before dividing the set of a plurality of original data into two, and S1 and S2 are the sum of squares of the objective variables of each set after the division.
[0065]
(Appendix 8) The evaluation process
The data analysis method according to appendix 6, wherein a value of t represented by the following expression is used as the set partition evaluation value.
[Expression 4]
[0066]
(Supplementary note 9)
7. The data analysis method according to appendix 6, wherein the number ratio of the extracted data belonging to each divided set after the division into two is used.
[0067]
(Supplementary Note 10) The evaluation step is as follows.
A statistical value list for evaluation is created in which an explanatory variable is attached in order from the smallest value of the S-ratio indicated by each divided set obtained by repeating the two divisions and the largest value of t. The data analysis method according to attachment 6.
[0068]
(Supplementary note 11) A data analysis program for performing data analysis of original data including an objective variable indicating a variation in quality of an analysis target and an explanatory variable explaining the variation of the objective variable,
A data extraction step for extracting data necessary for data analysis of the analysis target from the original data;
An attribution region determination step for determining which attribution region of a plurality of attribution regions set in advance on the two-dimensional coordinates of the analysis target corresponds to the data extracted by the data extraction step;
A two-dimensional data distribution feature amount extraction step for extracting a two-dimensional data distribution feature amount for each determined attribution region using the data extracted in the data extraction step;
A data analysis program for performing data analysis using the two-dimensional data distribution feature amount extracted by the two-dimensional data distribution feature amount extraction step.
[0069]
(Supplementary Note 12) Data extraction means for extracting data necessary for analysis of data to be analyzed from original data;
Belonging area determination means for determining which belonging area among a plurality of belonging areas set in advance on the two-dimensional coordinates to be analyzed corresponds to the data extracted by the data extracting means;
Two-dimensional data distribution feature quantity extraction means for extracting a two-dimensional data distribution feature quantity for each belonging area determined by the belonging area determination means using the data extracted by the data extraction means;
Data analysis means for analyzing data using the extracted two-dimensional data distribution feature quantity;
A data analysis apparatus comprising:
[0070]
(Supplementary note 13) Clarification of division when the data set obtained by the data analysis means is divided into two as information representing the reliability of the rule which is the feature or rule of the two-dimensional data analyzed by the data analysis means 13. The data analysis apparatus according to appendix 12, further comprising an evaluation unit that obtains a set division evaluation value representing a degree.
[0071]
(Additional remark 14) The said analysis object is each chip | tip arrange | positioned in multiple numbers on the surface of a semiconductor wafer, The characteristic value of each said chip | tip is output as said original data,
The belonging area determining means divides the wafer surface into a plurality of areas, and includes the divided areas in any two areas to determine the belonging area. The data analysis apparatus according to
[0072]
(Supplementary Note 15) The two-dimensional data distribution feature amount extraction means includes:
[0073]
【The invention's effect】
According to the present invention, the two-dimensional coordinates of individual data are extracted to determine which divided area the individual data of the two-dimensional feature extraction target to be analyzed belongs, and for each area division pattern. Since it can be determined as to which region it belongs and can be obtained as a continuous value, the ratio depending on the experience and know-how of engineers can be reduced and two-dimensional feature values can be easily defined and extracted, and the extracted feature values are used. Thus, the data distribution feature on the two-dimensional coordinates can be easily extracted, and the data analysis can be performed efficiently.
[Brief description of the drawings]
FIG. 1 is a diagram showing an example of a hardware configuration of a computer system that is provided for carrying out a data analysis method according to an embodiment of the present invention.
FIG. 2 is a block diagram showing an example of a functional configuration of a data analysis apparatus realized by the computer system having the configuration shown in FIG.
FIG. 3 is a diagram illustrating a definition of distribution features extracted by a two-dimensional data distribution feature extraction unit;
FIG. 4 is a diagram illustrating an example in which a plurality of areas are divided into two.
FIG. 5 is a diagram showing feature amounts obtained for each division type of each region;
FIG. 6 is a diagram showing an example of input data when actually executing a regression tree analysis.
FIG. 7 is a diagram illustrating a regression tree analysis result.
FIG. 8 is a flowchart showing an outline of a data analysis method according to the present invention.
FIG. 9 is a diagram showing a display screen used in conventional data analysis.
FIG. 10 is a view showing a distribution in a wafer plane of chips that have passed the characteristic test.
[Explanation of symbols]
1 Input device
2 Central processing unit
3 Output device
4 storage devices
21 Data distribution feature extraction means
22 Means for selecting analysis target feature
23 Data mining means
24 Feature and regularity rule files
25 Statistical analysis components
26 Charting components
27 Analysis tools
41 database
42 Original data group
Claims (4)
前記データ抽出工程により抽出されたウェーハ上のチップ歩留まりデータが解析対象の2次元座標上であらかじめ設定された複数の帰属領域のうちのどの帰属領域に該当するかを判定する帰属領域判定工程と、
前記データ抽出工程によって抽出されたウェーハ上のチップ歩留まりデータを用いて前記帰属領域判定工程によって判定された帰属領域別に2次元のデータ分布特徴量を抽出する2次元データ分布特徴量抽出工程と、
前記2次元データ分布特徴量抽出工程によって抽出された2次元のデータ分布特徴量を用いたデータの解析をおこなうデータ解析工程とを含み、
前記2次元データ分布特徴量抽出工程は、
前記2次元のデータ分布特徴量を、複数の前記帰属領域を2つの領域に2分割し、分割した2つの領域の代表値を用いた所定の算出式に基づき連続値として算出することで前記2次元のデータ分布特徴量を抽出することを特徴とするウェーハ上のチップ歩留まりのデータ解析方法。A data extraction process for extracting chip yield data on the wafer necessary for analyzing the data to be analyzed from the original data;
An attribution region determination step of determining which attribution region among a plurality of attribution regions set in advance on the two-dimensional coordinates to be analyzed corresponds to the chip yield data on the wafer extracted by the data extraction step;
A two-dimensional data distribution feature amount extraction step for extracting a two-dimensional data distribution feature amount for each belonging region determined by the belonging region determination step using chip yield data on the wafer extracted by the data extraction step;
A data analysis step of analyzing data using the two-dimensional data distribution feature amount extracted by the two-dimensional data distribution feature amount extraction step,
The two-dimensional data distribution feature extraction step includes:
By calculating the two-dimensional data distribution feature amount as a continuous value based on a predetermined calculation formula using a representative value of the divided two regions, the plurality of belonging regions are divided into two regions. A method for analyzing chip yield data on a wafer , characterized by extracting a dimensional data distribution feature.
前記2次元のデータ分布特徴量を目的変数として、解析すべき2次元のデータの特徴や規則を表すルールをデータマイニングにより抽出することを特徴とする請求項1または2に記載のウェーハ上のチップ歩留まりのデータ解析方法。The data analysis step includes
3. A chip on a wafer according to claim 1, wherein a rule representing a feature or rule of two-dimensional data to be analyzed is extracted by data mining using the two-dimensional data distribution feature amount as an objective variable. Yield data analysis method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002353833A JP4448653B2 (en) | 2002-12-05 | 2002-12-05 | Data analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002353833A JP4448653B2 (en) | 2002-12-05 | 2002-12-05 | Data analysis method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004186562A JP2004186562A (en) | 2004-07-02 |
JP4448653B2 true JP4448653B2 (en) | 2010-04-14 |
Family
ID=32755025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002353833A Expired - Fee Related JP4448653B2 (en) | 2002-12-05 | 2002-12-05 | Data analysis method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4448653B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5614297B2 (en) * | 2011-01-18 | 2014-10-29 | 富士通株式会社 | Index calculation program and method, and design support apparatus |
-
2002
- 2002-12-05 JP JP2002353833A patent/JP4448653B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004186562A (en) | 2004-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100414032B1 (en) | Apparatus for testing semiconductor, for analyzing defects in semiconductor, for correcting semiconductor design data, and method therefor, and computer readable recording media | |
US6711522B2 (en) | Data analysis apparatus, data analysis method, and computer products | |
US6826735B2 (en) | Inspection data analysis program, defect inspection apparatus, defect inspection system and method for semiconductor device | |
US9418199B2 (en) | Method and apparatus for extracting systematic defects | |
US6629090B2 (en) | method and device for analyzing data | |
US6741941B2 (en) | Method and apparatus for analyzing defect information | |
TWI783400B (en) | Device and method for estimating error factor | |
JP2008511140A (en) | Method and apparatus for detection of local outliers | |
US20090220142A1 (en) | Linear pattern detection method and apparatus | |
US11321633B2 (en) | Method of classifying defects in a specimen semiconductor examination and system thereof | |
US9142014B2 (en) | System and method for identifying systematic defects in wafer inspection using hierarchical grouping and filtering | |
JP5405245B2 (en) | Image inspection method and image inspection apparatus | |
JP2011187836A (en) | Control method of semiconductor manufacturing apparatus and control system | |
JP4448653B2 (en) | Data analysis method | |
JP2003086689A (en) | Cad tool for failure analysis of semiconductor and failure analysis method of semiconductor | |
JP2008250910A (en) | Data mining method and process management method | |
JP4166247B2 (en) | Semiconductor design data correction method | |
JPH10275168A (en) | Design support method and design support system | |
JP2002324206A (en) | Data analysis method and device | |
JP4866520B2 (en) | Data analysis method, data analysis program, and data analysis apparatus | |
JP4276503B2 (en) | Methods for narrowing down the causes of semiconductor defects | |
JP4136109B2 (en) | Electronic device inspection system | |
JP5767836B2 (en) | Inspection system, inspection method, and inspection program | |
JP2008117380A (en) | Method and program for supporting diagnostic process | |
JP7289749B2 (en) | data system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051125 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20080730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090901 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100119 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100125 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130129 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130129 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130129 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140129 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |