KR102625347B1 - 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 - Google Patents
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 Download PDFInfo
- Publication number
- KR102625347B1 KR102625347B1 KR1020210154049A KR20210154049A KR102625347B1 KR 102625347 B1 KR102625347 B1 KR 102625347B1 KR 1020210154049 A KR1020210154049 A KR 1020210154049A KR 20210154049 A KR20210154049 A KR 20210154049A KR 102625347 B1 KR102625347 B1 KR 102625347B1
- Authority
- KR
- South Korea
- Prior art keywords
- noun
- unregistered
- nouns
- food
- verbs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 156
- 238000000034 method Methods 0.000 title abstract description 44
- 239000000284 extract Substances 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims description 8
- 230000015654 memory Effects 0.000 abstract description 19
- 238000004458 analytical method Methods 0.000 description 20
- 238000000605 extraction Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 12
- 230000002996 emotional effect Effects 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 7
- 230000008451 emotion Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 235000009508 confectionery Nutrition 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 235000005135 Micromeria juliana Nutrition 0.000 description 1
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 241000246354 Satureja Species 0.000 description 1
- 235000007315 Satureja hortensis Nutrition 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 일 실시예에 따른 클라이언트 장치 및 서버의 내부 구성을 설명하기 위한 것이다.
도 3a 내지 도 3c는 본 발명의 다양한 실시예에 따른 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법에 대한 흐름도이다.
도 4 내지 도 7은 음식 메뉴 명사 추출 프로그램의 실행에 따라 클라이언트 장치에서 표시되는 유저 인터페이스를 개략적으로 나타낸 것이다.
클라이언트 장치(100)
서버(200)
네트워크(300)
메모리(110, 210)
프로세서(120, 220)
통신 모듈(130, 230)
입출력 인퍼테이스(140, 240)
입출력 장치(141, 241)
Claims (12)
- 삭제
- 삭제
- 클라이언트 장치는 수신한 음식명 검색어를 서버로 전송하고,
상기 서버는 수신된 음식명 검색어를 포함하는 웹페이지를 검색하고, 검색된 웹페이지 내에서 음식명 검색어를 포함한 문장을 수집하고, 수집된 음식명 검색어를 포함한 문장들에서 동일한 용언의 검출 빈도수를 계산하여 검출 빈도수가 기 설정치 이상인 용언을 추출하고, 추출된 용언을 검색어로 하여 웹페이지를 검색하고 검색된 웹페이지 내에서 용언을 포함한 문장을 수집하며, 수집된 용언을 포함한 문장들에서 용언이 수식하는 명사를 추출하고, 추출된 명사들 각각이 속한 문장에서의 명사 좌우의 문맥의 의미와 용언을 분석하여 명사가 음식명에 해당하는지 여부에 관한 추정치를 계산하고, 추출된 명사가 사전 데이터베이스 상의 등록 명사인지 여부를 판단하여, 상기 사전 데이터베이스 상에서 검색이 가능한 명사인 경우 해당 명사의 의미 정보를 상기 사전 데이터베이스 상에서 파악하여 검색된 명사가 등록 음식명 또는 비음식명에 해당하는 것인지를 판단하고, 상기 사전 데이터베이스에 등록되지 않은 미등록명사를 추출하고, 상기 미등록명사와 상기 등록 음식명의 음절간의 동일성 여부를 판단하여 상기 등록 음식명과 상기 미등록명사 사이의 유사도를 계산하고,
상기 클라이언트 장치는 상기 미등록명사를 제1 미등록 명사 표시 영역에 상기 등록 음식명과의 유사도에 따라 정렬하여 표시하고, 상기 미등록명사를 제2 미등록 명사 표시 영역에 상기 미등록명사의 검출 빈도수에 따라 정렬하여 표시하고, 상기 등록 음식명을 검출 빈도수에 따라 정렬하여 표시하고, 표시된 용언의 선택에 응답하여 태그어 저장 어포던스를 표시하고, 상기 태그어 저장 어포던스의 선택에 응답하여 선택된 용언 및 명사를 태그어로서 저장하고, 상기 미등록명사의 선택에 응답하여 선택된 미등록명사를 추출했던 문장 정보를 표시하고,
상기 서버는 표시된 문장 내의 텍스트 중 적어도 일부의 드레그된 텍스트인 등록용 텍스트 정보와 선택된 미등록명사를 서로 다른 복수의 클라이언트 장치들로부터 각각 수신하고, 동일한 미등록명사에 매칭된 복수의 등록용 텍스트 정보들 상호간의 유사도를 검출하고, 기 설정치 이상의 유사도를 나타내는 등록용 텍스트 정보들을 추출하고 추출된 등록용 텍스트 정보들의 정량적인 개수를 산출하고, 미리 설정된 개수를 초과하는 등록용 텍스트 정보가 확인되면 해당 등록용 텍스트 정보들 중 어느 하나의 등록용 텍스트 정보를 해당 등록용 텍스트 정보에 매칭되는 미등록명사의 승인된 의미 정보로 설정하여 해당 미등록명사를 등록 명사로 지위를 전환하여 상기 사전 데이터베이스에 등록하고, 지위가 전환된 등록 명사의 의미 정보로서 승인된 등록용 텍스트 정보를 등록하여 상기 사전 데이터베이스를 업데이트하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템. - 제3 항에 있어서,
상기 서버는 기 등록된 관심 모니터링 사이트 목록 정보에 해당하는 사이트 상에서 상기 음식명 검색어를 포함하는 웹페이지를 검색하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템. - 제4 항에 있어서,
상기 서버는 상기 음식명 검색어에 기초하여 이미 검색된 웹페이지와 동일한 웹페이지와 중복되는 웹페이지를 제외한 다른 웹페이지 내에서 용언을 포함한 문장을 수집하는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템. - 삭제
- 삭제
- 삭제
- 삭제
- 제5 항에 있어서,
상기 클라이언트 장치는 표시된 미등록 명사들 중 어느 하나의 선택에 응답하여 상기 서버로부터 선택된 미등록 명사를 포함한 문장 정보를 수신하여 표시하고, 상기 문장 정보에는 상기 선택된 미등록 명사가 하이라이트 되어 표시되는
동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출하는 시스템. - 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210154049A KR102625347B1 (ko) | 2021-11-10 | 2021-11-10 | 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210154049A KR102625347B1 (ko) | 2021-11-10 | 2021-11-10 | 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230068092A KR20230068092A (ko) | 2023-05-17 |
KR102625347B1 true KR102625347B1 (ko) | 2024-01-15 |
Family
ID=86547198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210154049A Active KR102625347B1 (ko) | 2021-11-10 | 2021-11-10 | 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102625347B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009295052A (ja) * | 2008-06-06 | 2009-12-17 | Yahoo Japan Corp | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム |
JP2011008373A (ja) * | 2009-06-24 | 2011-01-13 | Fuji Xerox Co Ltd | 自然言語処理装置及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100682897B1 (ko) * | 2004-11-09 | 2007-02-15 | 삼성전자주식회사 | 사전 업데이트 방법 및 그 장치 |
KR100886687B1 (ko) | 2007-12-12 | 2009-03-04 | 한국전자통신연구원 | 중국어 미등록어 자동 추출 방법 및 장치 |
KR101042515B1 (ko) | 2008-12-11 | 2011-06-17 | 주식회사 네오패드 | 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 |
KR20140078312A (ko) | 2012-12-17 | 2014-06-25 | 한국전자통신연구원 | 텍스트 기반 감성 분석 결과를 제공하기 위한 장치, 시스템 및 그 방법 |
KR20150022583A (ko) | 2013-08-23 | 2015-03-04 | 주식회사 케이티 | 키워드를 추출하는 장치 및 방법 |
KR102146261B1 (ko) * | 2014-02-14 | 2020-08-20 | 삼성전자 주식회사 | 전자 장치 및 전자 장치의 대화 메시지에서 의미개체 추출 및 이용방법 |
KR20160056983A (ko) * | 2014-11-12 | 2016-05-23 | 한국전자통신연구원 | 미등록어 자동 추출에 기반한 형태소 사전 구축 시스템 및 방법 |
KR101935109B1 (ko) | 2016-12-29 | 2019-01-04 | (주) 더아이엠씨 | 패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체 |
KR102019756B1 (ko) | 2017-03-14 | 2019-09-10 | 한국전자통신연구원 | 신조어 자동 인식을 위한 언어 분석에 기반한 온라인 문맥 광고 지능화 장치 및 그 방법 |
-
2021
- 2021-11-10 KR KR1020210154049A patent/KR102625347B1/ko active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009295052A (ja) * | 2008-06-06 | 2009-12-17 | Yahoo Japan Corp | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム |
JP2011008373A (ja) * | 2009-06-24 | 2011-01-13 | Fuji Xerox Co Ltd | 自然言語処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20230068092A (ko) | 2023-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bharti et al. | Sarcastic sentiment detection in tweets streamed in real time: a big data approach | |
Asghar et al. | Sentiment analysis on youtube: A brief survey | |
US8452772B1 (en) | Methods, systems, and articles of manufacture for addressing popular topics in a socials sphere | |
Bansal et al. | Hybrid attribute based sentiment classification of online reviews for consumer intelligence | |
JP6749110B2 (ja) | ソーシャルメディアにおける言語識別 | |
US20130060769A1 (en) | System and method for identifying social media interactions | |
KR101723862B1 (ko) | 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치 | |
Fayaz et al. | Machine learning for fake news classification with optimal feature selection | |
Lopez Barbosa et al. | Evaluating hotels rating prediction based on sentiment analysis services | |
US10740406B2 (en) | Matching of an input document to documents in a document collection | |
Banjar et al. | Aspect-Based Sentiment Analysis for Polarity Estimation of Customer Reviews on Twitter. | |
Kolajo et al. | Real-time event detection in social media streams through semantic analysis of noisy terms | |
Rahate et al. | Feature selection for sentiment analysis by using svm | |
Mehrbod et al. | Tender calls search using a procurement product named entity recogniser | |
US20160350278A1 (en) | Claim polarity identification | |
Nguyen et al. | Statistical approach for figurative sentiment analysis on social networking services: a case study on twitter | |
US20220365956A1 (en) | Method and apparatus for generating patent summary information, and electronic device and medium | |
Shekhawat | Sentiment classification of current public opinion on BREXIT: Naïve Bayes classifier model vs Python’s TextBlob approach | |
US12153891B2 (en) | Classification of user sentiment based on machine learning | |
Saghayan et al. | Exploring the impact of machine translation on fake news detection: A case study on persian tweets about covid-19 | |
Abudalfa et al. | Survey on target dependent sentiment analysis of micro-blogs in social media | |
Reddy et al. | Classification of user’s review using modified logistic regression technique | |
AleEbrahim et al. | Summarising customer online reviews using a new text mining approach | |
Narmadha et al. | A survey on online tweet segmentation for linguistic features | |
US8195458B2 (en) | Open class noun classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20211110 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230518 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20231013 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20240111 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20240111 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |