KR20050026732A - Method for providing optimized spelling correction word according to user - Google Patents
Method for providing optimized spelling correction word according to user Download PDFInfo
- Publication number
- KR20050026732A KR20050026732A KR1020030062344A KR20030062344A KR20050026732A KR 20050026732 A KR20050026732 A KR 20050026732A KR 1020030062344 A KR1020030062344 A KR 1020030062344A KR 20030062344 A KR20030062344 A KR 20030062344A KR 20050026732 A KR20050026732 A KR 20050026732A
- Authority
- KR
- South Korea
- Prior art keywords
- typo
- word
- correction
- user
- providing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
1. 청구범위에 기재된 발명이 속하는 기술분야1. TECHNICAL FIELD OF THE INVENTION
본 발명은, 사용자별로 최적화된 오타 교정 단어 제공 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.The present invention relates to a method of providing a typo corrected word optimized for each user and a computer-readable recording medium having recorded thereon a program for realizing the method.
2. 발명이 해결하려고 하는 기술적 과제2. The technical problem to be solved by the invention
본 발명은, 사용자의 타이핑 습성에 따른 오타 교정 이력을 데이터베이스에 저장하고, 상기 데이터베이스에 저장된 오타 교정 이력을 이용하여 사용자별로 최적화된 오타 교정 단어를 제공하기 위한, 사용자별로 최적화된 오타 교정 단어 제공 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.The present invention provides a method for providing a typo correcting word optimized for each user to store a typo correction history according to a user's typing habit in a database and to provide a typo correcting word optimized for each user by using the typo correction history stored in the database. And a computer readable recording medium having recorded thereon a program for realizing the method.
3. 발명의 해결 방법의 요지3. Summary of the Solution of the Invention
본 발명은, 사용자별로 최적화된 오타 교정 단어 제공 방법에 있어서, 사용자별로 최적화된 오타 교정 단어 제공 방법에 있어서, 맞춤법 검사기가 문서(또는 문서의 선택 부분)의 맞춤법 검사를 요청받는 제 1 단계; 상기 맞춤법 검사기가 상기 맞춤법 검사를 요청받은 문서(또는 문서의 선택 부분)에서 검사 단위의 문자를 읽어들여, 단어 사전을 이용하여 오타 검사를 수행하는 제 2 단계; 상기 제 2 단계의 검사 결과에 따라 오타로 확인된 상기 검사 단위의 문자에 상응하는 교정 단어들을 교정 이력 데이터베이스로부터 추출한 후, 오타 교정 단어로서 제공하는 제 3 단계; 및 상기 맞춤법 검사기가 상기 오타 교정 단어 제공에 따른 사용자 선택 결과를 전달받아, 상기 교정 이력 데이터베이스를 갱신하는 제 4 단계를 포함함.The present invention provides a method for providing a typo correcting word optimized for each user, the method for providing a typo correcting word optimized for each user, the method comprising: a first step of a spell checker requesting a spell check of a document (or a selected portion of a document); A second step of the spell checker reading a letter of a check unit from a document (or a selected portion of the document) requested to check the spelling, and performing a typo check using a word dictionary; A third step of extracting correction words corresponding to a character of the inspection unit identified as a typo according to the inspection result of the second step from a calibration history database and providing the correction words as a typo correction word; And a fourth step of the spell checker receiving the user selection result according to the typo correcting word provided and updating the calibration history database.
4. 발명의 중요한 용도4. Important uses of the invention
본 발명은 워드 프로세서 등에 이용됨.The present invention is used in word processors and the like.
Description
본 발명은, 사용자별로 최적화된 오타 교정 단어 제공 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.The present invention relates to a method for providing an error correction word optimized for each user and a computer-readable recording medium having recorded thereon a program for realizing the method.
철자란, 자음(子音)과 모음(母音)을 짜맞추어 글자를 만드는 것을 일컬으며, 그 방법은 각 나라마다 규정된 철자법 또는 맞춤법에 의한다. 한국어는 "자음+모음+자음"의 원칙에 따라 철자가 이루어지고, 영어는 모음과 자음의 결합방식이 40가지 이상이나 되며, 역사적인 철자법이 그대로 남아 있기 때문에 발음과 철자와의 관계가 복잡한 편이다.Spelling refers to the formation of letters by combining consonants and vowels. The method is spelled or spelled according to each country. Korean is spelled according to the principle of "consonant + vowel + consonant", English has more than 40 combinations of vowels and consonants, and historical spelling remains intact, so the relationship between pronunciation and spelling is complicated. .
한편, 사용자가 문서 처리기 또는 문서 편집기 등에서 작성한 문서에는 사용자가 복잡한 맞춤법을 완벽하게 숙지하지 못함으로 인하여, 또는 실수로 인하여 오타가 다수 존재하게 된다. 이와 같이, 문서에 존재하는 오타는 맞춤법 검사기(Spelling Checker)를 이용하여 자동으로 검사하고 교정할 수 있다.On the other hand, a document written by a user in a document processor or a text editor, etc., a large number of typos due to the user's incomplete knowledge of complex spelling or a mistake. As such, typos in a document can be automatically checked and corrected using a spelling checker.
일반적으로, 맞춤법 검사기는 문서 처리기 또는 문서 편집기 등에 하나의 기능(메뉴)으로 포함되어 있으며, 대부분의 맞춤법 검사기가 어절 단위를 대상으로 검사 및 교정을 수행하나, 최근에는 문장 전체의 구문을 분석하여 교정을 수행하기도 한다. 본 발명은 맞춤법 검사기의 다양한 기능 중 오타 교정 기능을 그 대상으로 한다.In general, the spell checker is included as a function (menu) in a document processor or a text editor, and most spell checkers check and correct word units, but recently, the sentence is parsed and corrected. It can also be done. The present invention targets a typo correction function among the various functions of the spell checker.
도 2는 종래의 맞춤법 검사기의 오타 교정 단어 제공 방법에 대한 일실시예 흐름도이다.2 is a flowchart illustrating a method for providing a typo correcting word of a conventional spell checker.
먼저, 맞춤법 검사기가 외부(예를 들어, 워드 프로세서의 제어부로부터)로부터 현재 작업중인 문서(또는 문서의 선택 부분)의 맞춤법 검사를 요청받으면(201), 상기 요청받은 문서(또는 문서의 선택 부분)의 시작부터 검사 단위(단어 또는 어절)의 문자를 읽어들인다(202). 일반적으로는 문서 내에서 쉼표, 특수 단어, 스페이스 바(Space Bar), 엔터 키(Enter Key) 등의 입력에 의하여 검사 단위를 구별한다.First, if a spell checker is requested (201) a spell check of a document (or a selected portion of a document) currently being worked on from the outside (e.g., from a control of a word processor), the requested document (or a selected portion of a document) The character of the test unit (word or word) is read from the beginning of 202. In general, check units are distinguished by input of a comma, a special word, a space bar, an enter key, or the like within a document.
이후, 상기 읽어들인 검사 단위의 문자가 단어 사전에 존재하는지를 확인하여(203), 상기 읽어들인 검사 단위의 문자가 단어 사전에 존재하면 "202" 과정으로 진행하여 다음 검사 단위를 처리하고, 단어 사전에 존재하지 않으면 유사 알고리즘(Similarity Algorithm)을 이용하여 상기 단어 사전으로부터 유사 단어들을 추출한 후, 도 3에 도시된 바와 같이 오타 교정 단어로서 제공한다(204). 이 때, 맞춤법 검사기는 오타 교정 단어를 제공하기에 앞서, 워드 프로세서의 제어부에 오타 발생을 알림으로써, 상기 워드 프로세서의 제어부가 표시장치에 출력된 문서의 해당 단어(또는 어절)에 밑줄 등을 출력하도록 한다. 그러면, 사용자는 잘못 입력된 단어(오타)를 문서 내에서 확인함과 동시에 맞춤법 검사기가 제공하는 오타 교정 단어를 확인하고, 이 가운데 한 단어를 선택하거나 또는 무시(교정하지 않고 지나감)하게 된다. Thereafter, it is checked whether the letter of the read test unit exists in the word dictionary (203). If the read check unit is present in the word dictionary, the process proceeds to step “202” to process the next test unit, and the word dictionary If not present in the word dictionary using a similarity algorithm (Similarity Algorithm) is extracted from the word dictionary, as shown in Figure 3 is provided as a typo correction word (204). At this time, the spell checker notifies the controller of the word processor of the typographical error prior to providing the typo correcting word, and the controller of the word processor outputs an underline or the like to the corresponding word (or word) of the document output on the display device. Do it. Then, the user checks the misspelled word in the document and at the same time checks the misspelling word provided by the spell checker, and selects one word or ignores (not corrects) the word.
이후, 문서의 끝까지 맞춤법 검사가 완료되었는지를 확인하여(205), 완료되었으면 종료하고, 완료되지 않았으면 "202" 과정으로 진행하여 다음 검사 단위를 처리한다. 도 3을 참조하여 보다 구체적인 일실시예를 살펴보기로 한다.Thereafter, it is checked whether the spell check is completed until the end of the document (205). If the check is completed, the process is terminated. If not, the process proceeds to step "202" to process the next check unit. A more specific embodiment will be described with reference to FIG. 3.
도 3은 종래의 맞춤법 검사기의 오타 교정 제공 방법에 대한 일실시예 설명도이다.3 is a diagram illustrating an example of a method for providing a typo correction of a conventional spell checker.
예를 들어, 맞춤법 검사기가 워드 프로세서의 제어부로부터의 요청에 따라 특정 문서에 대한 맞춤법 검사를 수행하는 중에 "textare" 또는 "testare"라는 단어를 입력받으면, 단어 사전에 상기 단어("textare" 또는 "testare")가 존재하는지를 먼저 확인한다. 상기 확인 결과, 단어 사전에 상기 단어("textare" 또는 "testare")가 존재하지 않으므로 유사 알고리즘을 이용하여 "31" 또는 "32"와 같이 오타 교정 단어를 제공하게 된다.For example, if a spell checker receives a word "textare" or "testare" while performing a spell check on a particular document in response to a request from a word processor control unit, the word dictionary "textare" or " testare ") to see if it exists first. As a result of the checking, since the word ("textare" or "testare") does not exist in the word dictionary, a similar algorithm is used to provide an error correction word such as "31" or "32".
즉, 도 3에 도시된 바와 같이, "textare"의 경우에는 "Texture", "Text are", "Textured", "Textures" 순으로 오타 교정 단어가 제공되며, "testare"의 경우에는 "Testate", "Testier", "Test are", "Tester", "Testers" 순으로 오타 교정 단어가 제공된다. 이 때, 사용자에게 제공되는 오타 교정 단어는 유사 알고리즘(Similarity Algorithm)에 의하여 추출된 유사 단어들이 기설정된 순서에 의하여 모든 사용자에게 일괄적으로, 동일하게 제공된다. That is, as shown in FIG. 3, in the case of "textare", a typo correcting word is provided in the order of "Texture", "Text are", "Textured", and "Textures", and in the case of "testare", "Testate". A typo correction word is provided in the following order: "Testier", "Test are", "Tester", "Testers". In this case, the typo correcting word provided to the user is provided to all users in the same manner in a predetermined order in which similar words extracted by the similarity algorithm (Similarity Algorithm).
그런데, 사용자는 개인마다의 타이핑 습성에 의하여 동일한 오타를 습관적으로 입력하는 경향이 있다. 따라서, 종래 방법과 같이 모든 사용자에게 일괄적인 순서에 의하여 오타 교정 단어를 제공하는 방식은 사용자마다 최적화된 오타 교정 단어를 제공해주지 못하는 문제점이 있었다.However, the user tends to habitually input the same typo by typing habits for each individual. Therefore, the method of providing a typo correcting word in a batch order to all users as in the conventional method has a problem in that it is not possible to provide a typo correcting word optimized for each user.
본 발명은, 상기와 같은 문제점을 해결하기 위하여 제안된 것으로, 사용자의 타이핑 습성에 따른 오타 교정 이력을 데이터베이스에 저장하고, 상기 데이터베이스에 저장된 오타 교정 이력을 이용하여 사용자별로 최적화된 오타 교정 단어를 제공하기 위한, 사용자별로 최적화된 오타 교정 단어 제공 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다. The present invention has been proposed to solve the above problems, and stores a typo correction history according to a user's typing habit in a database, and provides a typo correction word optimized for each user by using a typo correction history stored in the database. To provide a method for providing a typo corrected word optimized for each user and a computer-readable recording medium having recorded thereon a program for realizing the method.
상기의 목적을 달성하기 위한 본 발명은, 사용자별로 최적화된 오타 교정 단어 제공 방법에 있어서, 맞춤법 검사기가 문서(또는 문서의 선택 부분)의 맞춤법 검사를 요청받는 제 1 단계; 상기 맞춤법 검사기가 상기 맞춤법 검사를 요청받은 문서(또는 문서의 선택 부분)에서 검사 단위의 문자를 읽어들여, 단어 사전을 이용하여 오타 검사를 수행하는 제 2 단계; 상기 제 2 단계의 검사 결과에 따라 오타로 확인된 상기 검사 단위의 문자에 상응하는 교정 단어들을 교정 이력 데이터베이스로부터 추출한 후, 오타 교정 단어로서 제공하는 제 3 단계; 및 상기 맞춤법 검사기가 상기 오타 교정 단어 제공에 따른 사용자 선택 결과를 전달받아, 상기 교정 이력 데이터베이스를 갱신하는 제 4 단계를 포함한다.In order to achieve the above object, the present invention provides a method for providing a typo correcting word optimized for each user, the method comprising: a first step in which a spell checker is requested to check a spelling of a document (or a selected portion of a document); A second step of the spell checker reading a letter of a check unit from a document (or a selected portion of the document) requested to check the spelling, and performing a typo check using a word dictionary; A third step of extracting correction words corresponding to a character of the inspection unit identified as a typo according to the inspection result of the second step from a calibration history database and providing the correction words as a typo correction word; And a fourth step of the spell checker receiving a user selection result according to the typo correcting word and updating the calibration history database.
또한, 본 발명은, 상기 맞춤법 검사기가 유사 알고리즘을 이용하여 상기 단어 사전으로부터 상기 검사 단위의 문자에 상응하는 유사 단어들을 추출하는 제 5 단계; 및 상기 맞춤법 검사기가 상기 추출한 유사 단어들 중 상기 교정 이력 데이터베이스로부터 추출한 교정 단어들을 제외한 나머지 단어들을 오타 교정 단어로서 추가적으로 제공하는 제 6 단계를 더 포함한다.The present invention also provides a method comprising: a fifth step of the spell checker extracting similar words corresponding to letters of the check unit from the word dictionary by using a similar algorithm; And a sixth step of the spell checker further providing, as a typo correcting word, words other than the corrected words extracted from the proofreading history database among the extracted similar words.
한편, 본 발명은, 프로세서를 구비한 컴퓨터에, 맞춤법 검사기가 문서(또는 문서의 선택 부분)의 맞춤법 검사를 요청받는 제 1 기능; 상기 맞춤법 검사기가 상기 맞춤법 검사를 요청받은 문서(또는 문서의 선택 부분)에서 검사 단위의 문자를 읽어들여, 단어 사전을 이용하여 오타 검사를 수행하는 제 2 기능; 상기 제 2 기능에서의 검사 결과에 따라 오타로 확인된 상기 검사 단위의 문자에 상응하는 교정 단어들을 교정 이력 데이터베이스로부터 추출한 후, 오타 교정 단어로서 제공하는 제 3 기능; 및 상기 맞춤법 검사기가 상기 오타 교정 단어 제공에 따른 사용자 선택 결과를 전달받아, 상기 교정 이력 데이터베이스를 갱신하는 제 4 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.On the other hand, the present invention provides a computer having a processor, comprising: a first function in which a spell checker is requested to check spelling of a document (or a selected portion of the document); A second function in which the spell checker reads a character of a check unit from a document (or a selected portion of the document) that has been requested to check the spelling, and performs a typo check using a word dictionary; A third function of extracting correction words corresponding to a character of the test unit identified as a typo according to a test result in the second function from a calibration history database, and then providing the correction words as a typo correction word; And a computer-readable recording medium storing a program for realizing a fourth function of updating the calibration history database by receiving the user selection result according to the typo correcting word provided by the spell checker.
또한, 본 발명은, 상기 맞춤법 검사기가 유사 알고리즘을 이용하여 상기 단어 사전으로부터 상기 검사 단위의 문자에 상응하는 유사 단어들을 추출하는 제 5 기능; 및 상기 맞춤법 검사기가 상기 추출한 유사 단어들 중 상기 교정 이력 데이터베이스로부터 추출한 교정 단어들을 제외한 나머지 단어들을 오타 교정 단어로서 추가적으로 제공하는 제 6 기능을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.In addition, the present invention, the spelling checker is a fifth function for extracting similar words corresponding to the letters of the check unit from the word dictionary using a similar algorithm; And a sixth function in which the spell checker further provides a sixth function of the extracted similar words except for the correction words extracted from the calibration history database as a typo correction word. to provide.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명이 적용되는 컴퓨터 시스템의 구성예시도이다.1 is an exemplary configuration diagram of a computer system to which the present invention is applied.
도 1에 도시된 바와 같이, 본 발명이 적용되는 일반적인 컴퓨터 시스템은 중앙처리장치(11)와, 상기 중앙처리장치(11)에 연결된 주기억장치(12)와, 상기 주기억장치(12)에 연결된 보조기억장치(13)와, 상기 중앙처리장치(11)에 연결된 입력장치(14) 및 표시장치(15)를 포함한다.As shown in FIG. 1, a general computer system to which the present invention is applied includes a central processing unit 11, a main memory device 12 connected to the central processing device 11, and an auxiliary device connected to the main memory device 12. A storage device 13, an input device 14 and a display device 15 connected to the central processing unit 11;
상기 중앙처리장치(11)는 컴퓨터의 전체 동작을 제어하고 관리하며, 주기억장치(12)는 상기 중앙처리장치(11)에서 수행되는 프로그램 및 작업 수행중 이용되는 또는 작업 수행중에 발생되는 각종 데이터를 저장한다. The central processing unit 11 controls and manages the overall operation of the computer, and the main memory unit 12 stores various programs that are used during the execution of a program or a task performed by the central processing unit 11 and various data generated during the execution of a task. Save it.
또한, 입력장치(14)는 주기억장치(12), 보조기억장치(13) 및 사용자로부터 데이터를 입력받으며, 표시장치(15)는 중앙처리장치(11)의 제어에 따라 데이터를 출력한다. 보조기억장치(13)는 중앙처리장치(11)의 제어에 따라 대량의 데이터를 저장하는 역할을 하며, 상기 입력장치 및 표시장치(14,15)는 일반적인 마우스, 키보드, 및 디스플레이 장치 등을 포함한다.In addition, the input device 14 receives data from the main memory device 12, the auxiliary memory device 13, and the user, and the display device 15 outputs data under the control of the central processing unit 11. The auxiliary memory device 13 stores a large amount of data under the control of the central processing unit 11, and the input device and the display devices 14 and 15 include a general mouse, a keyboard, a display device, and the like. do.
상기한 바와 같은 구성을 갖는 컴퓨터 시스템은 당해 분야에서 이미 주지된 기술에 지나지 아니하므로 여기에서는 그에 대한 자세한 설명은 생략하기로 한다. 그리고, 상기와 같은 컴퓨터 시스템은, 개인용 컴퓨터(PC), 휴대용 컴퓨터, 이동통신단말기, 스마트폰, 개인휴대용단말기(PDA), 차세대이동통신단말기(IMT-2000) 등과 같은 다양한 형태로 구현될 수 있다. 다만, 상기와 같은 컴퓨터 시스템의 보조기억장치(13)에는 개인별로 최적화된 오타 교정 단어를 제공하기 위한 알고리즘이 저장되어 있으며, 상기 중앙처리장치(11)의 제어에 따라 주기억장치(12)에 로딩되어 수행됨으로써 맞춤법 검사기의 기능을 수행하게 된다. Since the computer system having the configuration as described above is only a technique well known in the art, a detailed description thereof will be omitted herein. The computer system may be implemented in various forms such as a personal computer (PC), a portable computer, a mobile communication terminal, a smart phone, a personal digital assistant (PDA), and a next generation mobile communication terminal (IMT-2000). . However, in the auxiliary memory device 13 of the computer system, an algorithm for providing an error correction word optimized for each individual is stored, and loaded into the main memory device 12 under the control of the CPU 11. And performed to perform the function of a spell checker.
그리고, 상기 보조기억장치(13)에 저장되어 있는 오타 교정 단어 제공 알고리즘은 통상적으로 워드 프로세서에 포함된 형태 또는 참조가능한 형태로 존재할 수 있다. 따라서, 상기 보조기억장치(13)에 저장되어 있는 오타 교정 단어 제공 알고리즘은 워드 프로세서의 제어부에 의하여 실행되거나 참조될 수 있다. 또한, 상기 보조기억장치(13)에는 오타 교정 단어 제공 알고리즘에 이용되는 단어 사전 및 오타 교정 이력 데이터베이스가 저장되어 있다.In addition, the typo correcting word providing algorithm stored in the auxiliary memory device 13 may exist in a form commonly included in a word processor or in a referenceable form. Therefore, the error correction word providing algorithm stored in the auxiliary memory device 13 may be executed or referenced by the controller of the word processor. In addition, the auxiliary memory device 13 stores a word dictionary and a typographical correction history database used for the typographical correction word providing algorithm.
본 발명의 전체적인 동작은 도 4 내지 도 8을 참조하여 상세히 설명하기로 한다.The overall operation of the present invention will be described in detail with reference to FIGS. 4 to 8.
도 4는 본 발명에 따른 사용자별로 최적화된 오타 교정 단어 제공 방법에 대한 일실시예 흐름도이다.4 is a flowchart illustrating a method for providing a typo correcting word optimized for each user according to the present invention.
먼저, 맞춤법 검사기가 외부(예를 들어, 워드 프로세서의 제어부로부터)로부터 현재 작업중인 문서(또는 문서의 선택 부분)의 맞춤법 검사를 요청받으면(401), 상기 요청받은 문서(또는 문서의 선택 부분)의 시작부터 검사 단위(단어 또는 어절)의 문자를 읽어들인다(402).First, if a spell checker is requested (401) a spell check of a document (or a selected portion of a document) currently being worked on from the outside (e.g., from a control of a word processor), the requested document (or a selected portion of a document) The character of the test unit (word or word) is read from the beginning of the character (402).
그리고, 상기 읽어들인 검사 단위의 문자가 단어 사전에 존재하는지를 확인하여(403), 상기 읽어들인 검사 단위의 문자가 단어 사전에 존재하면 "402" 과정으로 진행하여 다음 검사 단위를 처리한다.If the read check unit has a letter in the word dictionary (403), and if the read check unit has a letter in the word dictionary, the process proceeds to step "402" to process the next check unit.
한편, 상기 확인 결과(403), 상기 읽어들인 검사 단위의 문자가 단어 사전에 존재하지 않으면 교정 이력 데이터베이스로부터 상기 읽어들인 검사 단위의 문자에 상응하는 단어들을 추출한다(404). 이 때, 상기 교정 이력 데이터베이스에는 사용자가 현재까지 교정한 오타들에 대한 정보가 저장되어 있다.Meanwhile, when the check result 403 does not exist in the word dictionary of the read test unit, words corresponding to the read test unit letter are extracted from the calibration history database (404). At this time, the calibration history database stores information on typos corrected up to now.
이후, 상기 맞춤법 검사기가 상기 교정 이력 데이터베이스로부터 추출한 단어들을 빈도수에 따라 내림차순으로 정렬하여 오타 교정 단어로서 제공하게 된다(405). 이 때, 상기 맞춤법 검사기가 오타 교정 단어를 제공하는 과정을 좀 더 자세히 살펴보면 다음과 같다. Thereafter, the spell checker sorts the words extracted from the calibration history database in descending order according to the frequency and provides them as a typo correcting word (405). In this case, the spelling checker will be described in more detail as follows.
먼저, 맞춤법 검사기가 특정 문서의 맞춤법 검사중에 오타를 발견하면 워드 프로세서의 제어부에 이를 알리고, 상기 워드 프로세서의 제어부는 현재 표시장치에 출력된 문서의 해당 단어(또는 어절)에 밑줄 등을 출력시키는 한편, 상기 맞춤법 검사기로부터 전달받은 오타 교정 단어들을 표시장치 등에 출력시킨다. 그러면, 사용자는 잘못 입력된 단어(오타)를 문서 내에서 확인함과 동시에 맞춤법 검사기가 제안하는 오타 교정 단어를 확인하고, 이 가운데 한 단어를 선택하여 오타를 교정하거나 또는 교정하지 않고 무시한다. First, if the spell checker detects a typo while checking a spelling of a specific document, the word processor notifies the controller of the word processor, and the controller of the word processor outputs an underline or the like to the corresponding word (or word) of the document currently output on the display device. The typo-corrected words received from the spell checker are output to the display device. Then, the user checks the misspelled word (typo) in the document and at the same time checks the typo correcting word suggested by the spell checker, and selects one of these words and ignores or corrects the typo.
그러면, 맞춤법 검사기는 상기 워드 프로세서의 제어부로부터 오타 교정 단어 제공에 따른 사용자 선택 결과를 전달받아, 사용자가 오타를 교정한 단어가 존재하는지를 확인하여(406), 오타 교정 단어가 존재하지 않으면 "402" 과정으로 진행하여 다음 검사 단위를 처리하고, 오타 교정 단어가 존재하면 상기 전달받은 사용자 선택 결과에 따라 교정 이력 데이터베이스를 갱신한다(407).Then, the spell checker receives the user selection result according to the error correction word provided from the control unit of the word processor, and checks whether the user corrected the typo (406), and if the typo correction word does not exist "402" The process proceeds to the next test unit, and if there is a typo corrected word, the calibration history database is updated according to the received user selection result (407).
이후, 문서의 끝까지 맞춤법 검사가 완료되었는지를 확인하여(408), 완료되었으면 종료하고 완료되지 않았으면 "402" 과정으로 진행하여 다음 검사 단위를 처리한다.Thereafter, it is checked whether the spell check is completed until the end of the document (408), and if it is completed, the process is terminated and if it is not completed, the process proceeds to "402" to process the next inspection unit.
한편, 본 발명에 따른 교정 이력 데이터베이스의 구조를 살펴보면 도 5에 도시된 바와 같다. On the other hand, look at the structure of the calibration history database according to the present invention as shown in FIG.
도 5에 도시된 바와 같이, 본 발명에 따른 교정 이력 데이터베이스는 오류 단어 필드(51), 교정 단어 필드(52), 및 빈도수 필드(53)를 포함한다.As shown in FIG. 5, the calibration history database according to the present invention includes an error word field 51, a correction word field 52, and a frequency field 53.
상기 오류 단어 필드(51)에는 단어 사전에 등록되지 않은 단어로 판별된 검사 단위의 문자가 저장되고, 교정 단어 필드(52)에는 상기 검사 단위의 문자와 상응하여 사용자의 선택에 따라 최종적으로 교정된 단어가 저장되며, 빈도수 필드(53)에는 상기 검사 단위의 문자가 상기 교정 단어 필드(52) 값으로 교정된 빈도수가 저장된다.The error word field 51 stores characters of a test unit determined as a word not registered in the word dictionary, and the correction word field 52 is finally corrected according to a user's selection in correspondence with the characters of the test unit. The word is stored, and the frequency field 53 stores the frequency in which the letters of the test unit are corrected to the value of the correction word field 52.
예를 들어, 도 5에 도시된 바와 같이, 교정 이력 데이터베이스에 사용자의 오타 교정 이력이 저장되어 있는 상태에서, 사용자가 "textare" 라는 단어를 입력하면, 맞춤법 검사시 오타로 판별되어 도 6에 도시된 바와 같은 선택창이 사용자에게 제공된다. 즉, 맞춤법 검사기는 교정 이력 데이터베이스로부터 "textare" 에 해당하는 항목들의 교정 단어 필드(52)값을 빈도수 필드(53) 값의 내림차순으로 추출하여, 오타 교정 단어로서 제공한다. For example, as shown in FIG. 5, when a user inputs the word "textare" while a user's typo correction history is stored in a calibration history database, it is determined as a typo in a spell check and is shown in FIG. 6. The selection window as shown is provided to the user. That is, the spell checker extracts the correction word field 52 values of items corresponding to "textare" from the correction history database in descending order of the frequency field 53 value, and provides them as a typo correcting word.
따라서, "textare"의 경우, 빈도수에 따라 "texture"(521), "textures"(522), "textured"(523), "Text are"(524) 순으로 오타 교정 단어가 제공된다. 그리고, 사용자가 상기 맞춤법 검사기에서 제공된 오타 교정 단어 가운데 하나를 선택하여 오타를 교정하면, 그 결과는 교정 이력 데이터베이스에 반영된다. 즉, 사용자가 "texture"를 선택하여 오타("textare")를 교정하면 도 7에 도시된 바와 같이, 상응하는 빈도수 필드(701)의 값이 1 만큼 증가한다. Accordingly, in the case of "textare", a typo correcting word is provided in order of "texture" 521, "textures" 522, "textured" 523, and "Text are" 524 according to the frequency. When the user selects one of the typo correcting words provided by the spell checker to correct the typo, the result is reflected in the calibration history database. That is, when a user selects "texture" and corrects a "textare", the value of the corresponding frequency field 701 increases by 1, as shown in FIG.
또한, 같은 오타("textare")라도 다른 사용자의 교정 이력 데이터베이스에 저장된 값들이 다르면 도 8에 도시된 바와 같은 다른 순서("textures"(801), "texture"(802), "textured"(803), "Text are"(804))로 오타 교정 단어가 제공될 것이다. Also, if the same typos ("textare") have different values stored in another user's calibration history database, different order as shown in FIG. 8 ("textures" 801, "texture" 802, "textured" (803) , "Text are" (804) will be provided with a typo correcting word.
한편, 교정 이력 데이터베이스의 모든 필드는 초기에 널(NULL)값으로 초기화되어 있으며, 오타 교정 단어 제공 알고리즘의 이용에 의하여 추가(갱신)된다. 따라서, 사용자가 오랜 기간 동안 오타 교정 단어 제공 알고리즘을 이용하였을 경우에는 충분한 갯수의 오타 교정 단어를 제공할 수 있을 것이지만, 그렇지 않을 경우에는 충분한 갯수의 오타 교정 단어를 제공할 수 없을 것이다. 이를 보완하기 위하여, 종래의 일반적인 유사 알고리즘에 의한 오타 교정 단어 제공 방법을 절충하여 구현할 수도 있다.On the other hand, all fields of the calibration history database are initially initialized to null values and added (updated) by use of a typo correcting word providing algorithm. Therefore, if the user has used a typo correcting word providing algorithm for a long time, it may be possible to provide a sufficient number of typo correcting words, otherwise it may not be able to provide a sufficient number of typo correcting words. To compensate for this, an error correction word providing method by a conventional general similar algorithm may be compromised and implemented.
즉, 본 발명에 따른 오타 교정 단어 제공 알고리즘 및 종래의 유사 알고리즘을 이용하여 각각 오타 교정 단어를 추출하고, 사용자에게 제공시에는 상기 오타 교정 단어 제공 알고리즘에 의하여 추출된 오타 교정 단어들을 선택창에 우선적으로 배치한다. 그리고, 상기 유사 알고리즘에 따라 추출된 오타 교정 단어들 중 상기 오타 교정 단어 제공 알고리즘에 의하여 추출된 것을 제외한 나머지를 그 이후에 배치한다.That is, a typo correcting word is extracted using a typo correcting word providing algorithm and a conventional similar algorithm according to the present invention, and when provided to a user, the typo correcting words extracted by the typo correcting word providing algorithm are given priority to a selection window. To place. The rest of the error correction words extracted according to the similar algorithm except the one extracted by the error correction word providing algorithm is disposed thereafter.
이와 같은 방법에 의하여 사용자의 타이핑 습성에 따라 최적화된 오타 교정 단어를 제공할 수 있게 된다.In this manner, it is possible to provide a typo correcting word optimized according to a user's typing habit.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.The method of the present invention as described above may be implemented as a program and stored in a computer-readable recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.). Since this process can be easily implemented by those skilled in the art will not be described in more detail.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.The present invention described above is capable of various substitutions, modifications, and changes without departing from the spirit of the present invention for those skilled in the art to which the present invention pertains. It is not limited by the drawings.
상기와 같이 본 발명은, 사용자의 타이핑 습성에 따른 오타 교정 이력을 데이터베이스에 저장하고, 맞춤법 검사시에 상기 데이터베이스에 저장된 오타 교정 이력을 이용하여 교정 빈도수가 높은 순으로 오타 교정 단어를 제공함으로써, 사용자별로 최적화된 오타 교정 단어를 제공해 줄 수 있는 효과가 있다.As described above, the present invention stores a typo correction history according to a user's typing habit in a database, and provides a typo correction word in the order of high frequency of correction using the typo correction history stored in the database at the time of spell check. There is an effect that can provide very optimized typo correction words.
도 1은 본 발명이 적용되는 컴퓨터 시스템의 구성예시도.1 is an exemplary configuration diagram of a computer system to which the present invention is applied.
도 2는 종래의 맞춤법 검사기의 오타 교정 단어 제공 방법에 대한 일실시예 흐름도.2 is a flowchart illustrating a method for providing a typo correcting word of a conventional spell checker.
도 3은 종래의 맞춤법 검사기의 오타 교정 단어 제공 방법에 대한 일실시예 설명도.3 is a diagram illustrating an example of a method of providing a typo corrected word in a conventional spell checker.
도 4는 본 발명에 따른 사용자별로 최적화된 오타 교정 단어 제공 방법에 대한 일실시예 흐름도.4 is a flowchart illustrating a method for providing a typo correcting word optimized for each user according to the present invention.
도 5 내지 도 8은 본 발명에 따른 사용자별로 최적화된 오타 교정 단어 제공 방법에 대한 일실시예 설명도.5 to 8 are exemplary diagrams illustrating a method for providing a typo correcting word optimized for each user according to the present invention.
* 도면의 주요 부분에 대한 부호 설명* Explanation of symbols on the main parts of the drawing
11 : 중앙처리장치 12 : 주기억장치11: central processing unit 12: main memory unit
13 : 보조기억장치 14 : 입력장치13: auxiliary memory device 14: input device
15 : 표시장치15: display device
Claims (6)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020030062344A KR20050026732A (en) | 2003-09-06 | 2003-09-06 | Method for providing optimized spelling correction word according to user |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020030062344A KR20050026732A (en) | 2003-09-06 | 2003-09-06 | Method for providing optimized spelling correction word according to user |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20050026732A true KR20050026732A (en) | 2005-03-16 |
Family
ID=37384385
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020030062344A Ceased KR20050026732A (en) | 2003-09-06 | 2003-09-06 | Method for providing optimized spelling correction word according to user |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR20050026732A (en) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100988648B1 (en) * | 2007-12-27 | 2010-10-18 | 주식회사 다음커뮤니케이션 | Word proofing device and its method |
| US20160246771A1 (en) * | 2015-02-25 | 2016-08-25 | Kyocera Document Solutions Inc. | Text editing apparatus and print data storage apparatus that becomes unnecessary to reprint of print data |
| KR20180126262A (en) | 2017-05-17 | 2018-11-27 | 주식회사 한글과컴퓨터 | Assonantic terms correction system |
| KR102050266B1 (en) * | 2018-11-19 | 2019-12-02 | 이형종 | Server, method and computer program for providing english study service |
| CN111858049A (en) * | 2020-07-17 | 2020-10-30 | 浙江大搜车软件技术有限公司 | Resource information distribution method and device and computer equipment |
| KR20210076877A (en) | 2019-12-16 | 2021-06-24 | 부산대학교 산학협력단 | System and Method for Spell Checking using User Information |
| CN121072520A (en) * | 2025-09-04 | 2025-12-05 | 上海鲸甲信息科技有限公司 | A method, medium, and device for predicting the probability of user spelling errors |
-
2003
- 2003-09-06 KR KR1020030062344A patent/KR20050026732A/en not_active Ceased
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100988648B1 (en) * | 2007-12-27 | 2010-10-18 | 주식회사 다음커뮤니케이션 | Word proofing device and its method |
| US20160246771A1 (en) * | 2015-02-25 | 2016-08-25 | Kyocera Document Solutions Inc. | Text editing apparatus and print data storage apparatus that becomes unnecessary to reprint of print data |
| KR20180126262A (en) | 2017-05-17 | 2018-11-27 | 주식회사 한글과컴퓨터 | Assonantic terms correction system |
| KR102050266B1 (en) * | 2018-11-19 | 2019-12-02 | 이형종 | Server, method and computer program for providing english study service |
| KR20210076877A (en) | 2019-12-16 | 2021-06-24 | 부산대학교 산학협력단 | System and Method for Spell Checking using User Information |
| CN111858049A (en) * | 2020-07-17 | 2020-10-30 | 浙江大搜车软件技术有限公司 | Resource information distribution method and device and computer equipment |
| CN111858049B (en) * | 2020-07-17 | 2024-05-17 | 浙江大搜车软件技术有限公司 | Resource information distribution method and device and computer equipment |
| CN121072520A (en) * | 2025-09-04 | 2025-12-05 | 上海鲸甲信息科技有限公司 | A method, medium, and device for predicting the probability of user spelling errors |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9460066B2 (en) | Systems and methods for character correction in communication devices | |
| US20100235780A1 (en) | System and Method for Identifying Words Based on a Sequence of Keyboard Events | |
| US20080189606A1 (en) | Handheld electronic device including predictive accent mechanism, and associated method | |
| JP2013117978A (en) | Generating method for typing candidate for improvement in typing efficiency | |
| JP2003223437A (en) | Method of displaying candidate for correct word, method of checking spelling, computer device, and program | |
| US7328404B2 (en) | Method for predicting the readings of japanese ideographs | |
| US8219905B2 (en) | Automatically detecting keyboard layout in order to improve the quality of spelling suggestions | |
| KR20050026732A (en) | Method for providing optimized spelling correction word according to user | |
| US6731802B1 (en) | Lattice and method for identifying and normalizing orthographic variations in Japanese text | |
| JPS61156466A (en) | Word extracting system | |
| JP3290451B2 (en) | Electronic dictionary | |
| JPH07230472A (en) | Method for correcting erroneous reading of person's name | |
| JP2621999B2 (en) | Document processing device | |
| JP2833650B2 (en) | Document processing device | |
| JP3390567B2 (en) | Typo correction device | |
| JP2002351868A (en) | Electronic dictionary | |
| JPH10198664A (en) | Japanese language input system and medium for recorded with japanese language input program | |
| JPS5832418B2 (en) | Kanji-mixed sentence input device | |
| Jamwal | AVL and TRIE loading time in Dogri spell checker | |
| JPH0566875A (en) | Key input device | |
| JP3273778B2 (en) | Kana-kanji conversion device and kana-kanji conversion method | |
| JPH06119325A (en) | Word correction device | |
| JPH02250148A (en) | Character processor | |
| JPH06149791A (en) | Kanji sentence input device | |
| JP2000020513A (en) | Japanese input device and its method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20030906 |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20050525 Patent event code: PE09021S01D |
|
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20051221 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20050525 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |