[ Graduation Thesis ]
토픽모델링 및 SVM 기반 특허 클래스 자동분류
특허와 같은 지적재산권을 보유하는 것은 기술시장에서의 경쟁우위를 차지하는데 필수적이며, 4차 산업혁명은 이를 더 가속화시킬 것으로 전망된다. 이로 인해 특허 등록량은 갈수록 증가하고 있는 양상을 보이고 있으나 현재 전문가 기반의 정성적 접근 방식의 특허 분류제도는 증가하는 특허의 등록량을 처리하기에는 매우 제한적인 상황이다. 본 연구에서는 특허문서의 토픽을 기반으로 특허 클래스를 자동적으로 분류하는 새로운 방법을 제안하고자 한다.
본 연구는 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링과 지도학습(supervised learning)의 일종인 SVM(Support Vector Machine)을 활용하여 실제 특허 데이터를 기반으로 특허 클래스 자동분류를 수행하였다. 단순 문서내의 키워드 출현의 유사성이나 분포를 고려하기보다 여러 가지 기술적 토픽이 결합된 특허문서의 특성을 고려하여 토픽모델링을 통해 토픽확률벡터를 산출하여 SVM의 입력 값으로 활용했다. 20년간 미국특허청에 등록된 350만개의 특허 abstract를 활용하여 분석을 진행했고, 높은 분류 성능을 보이는 것을 확인하였다. 또한 특허 클래스 불균형 해소, description 텍스트 데이터 활용, 토픽의 개수 변화와 같은 방법으로 분류의 성능을 향상시킬 수 있는 방안을 제시했으며, 모두 일정 수준의 성능 향상에 기여하는 것을 확인하였다. 본 연구는 토픽에 대한 할당 확률을 기초로 한 확률벡터를 특허 표현 값으로 활용할 수 있으며, 제안한 성능향상 방안을 적용하여 높은 분류 성능이 도출되었음을 확인했다는 점에 의의가 있다. 전문가의 주관적인 판단이 작용하는 토픽모델링의 토픽선정 및 해석과정 대신 기계적인 학습과정을 통해 이를 대체했다는 점에서 의의가 있다. 본 연구에서 제안한 방식은 실질적인 특허 출원이나 심사과정에서 비용과 시간을 줄이고 조금 더 정확한 클래스 분류를 가능하게 할 것으로 기대된다.
[ Academic presentation ]
> Comparing Technological Trend Between Russia and South Korea
여수, 대한산업공학회 춘계학술대회 (2017.5)
Tohir Yuldoshev, 윤정환, 금영정
기술 트렌드의 분석, 즉 기술의 흐름을 파악하고 이해하는 것은 신기술 창출 및 개발을 위해
필수적인 활동이다. 특히 글로벌화로 인해 기술 개발 및 활용의 범위가 특정 국가에 제한되지
않고 기술혁신의 과정 및 결과가 전 세계에 공유되어 활용된다는 것을 고려할 때, 기술 트렌드의
국가적 비교는 매우 중요한 활동이라 볼 수 있다. 따라서 본 연구에서는 국가간 기술 트렌드의
차이를 비교하고 분석하기 위한 특허 기반 프레임워크를 제안하고, 한국과 러시아에 대한 사례
연구를 통해 모바일 산업 기술 트렌드를 비교 분석한다. 본 연구는 다음과 같이 구성된다. 먼저
기술트렌드 분석에 앞서, 국가간 기술 트렌드 비교를 위한 네 가지의 기술 트렌드 세부항목을
기술적 능력, 기술적 성장, 기술 집중도, 기술적 관계의 네 가지 항목으로 나누어 각각 정의한다.
먼저 기술적 능력은 등록된 특허의 수와 해당 특허의 피인용수를 통해 정의한다. 두 번째 기술적
성장은 시간에 따른 해당 국가의 특허의 수 및 피인용수의 증감추세를 통해 정의된다. 세 번째
항목인 기술 집중도는 해당 기술분야의 혁신이 얼마나 많은 기업들에 의해 이루어지는지를
판단하는 지표로, 시장 집중도 및 경쟁정도를 측정하는 CR3 와 허핀달 계수에 의해 분석된다.
마지막으로 기술적 관계에 대한 분석은 해당 국가의 특허에 관련된 IPC 코드의 동시출현분석을
통해 수행되며, 각 기술분야간 상호관계의 시각화를 위해 네트워크 분석이 활용된다. 본
연구에서는 위와 같이 정의된 네 가지 기술의 하위 트렌드에 대해 미국 특허청 USPTO 에서 특허
데이터를 수집하여 특허분석을 실시하고, 이를 러시아와 한국의 시장 상황을 고려하여 해석한다.
본 연구는 향후 국가간 기술 트렌드의 비교 분석을 통해 관련 벤치마킹 전략을 수립하기 위한
기초적 틀로 활용될 수 있을 것으로 기대된다.
> 특허 정보 동시분류분석을 통한 기술융합의 동태적 분석방법에 관한 연구
고려대학교, 대한산업공학회 추계학술대회 (2016.11)
윤정환, 금영정
기술융합의 동태적 분석은 시간에 따른 융합 양상을 살펴보고 관련 패턴을 발견함으로써 향후 산업발전에 대한 단서를 찾을 수 있다는 점에서 기술융합의 분석에 필수적인 활동이다. 그러나 대부분의 연구에서 기술융합 분석은 정태적 관점의 동시분류분석에 의존하고 있다. 이에 본 연구에서는 동태적 관점에서 특허정보의 동시분류분석을 수행하여 기술융합을 파악하기 위한 프레임워크를 제안한다. 본 연구에서는 각 특허의 IPC 쌍에 대한 동태적 기술융합 패턴을 6가지로 정의하고 해당 기술융합 패턴을 정량화하기 위한 동태적 관점의 지표를 제안한다. 마지막으로 본 프레임워크를 헬스케어 산업에 적용하여 1702개 IPC 쌍의 분석을 통해 헬스케어 산업에서의 동태적 기술융합 현상을 설명한다. 본 연구결과는 다양한 산업에 적용되어 해당 산업들의 기술융합 추세를 이해하고 앞으로 전략 수립에 도움이 될 것으로 기대된다.
[ Prize ]
> 제 5회 산업융합 활성화 방안 및 사례연구 논문공모전 최우수상 (1st Prize)
국가산업융합지원센터 / 대한산업공학회 (2016.11)
더보기