[xml] [original]



자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020) 분석



Better title

자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020) 분석








The purpose of this study is to analyze domestic and foreign research trends and future direction of Pinus densiflora in recent 20 years using text mining. A total of 3866 academic papers related to P


tags = 자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020) 분석, A Study on Research Trends (2001∼2020) of Pinus densiflora Using Text Mining Based on Natural Language Processing, 빅데이터, 소나무, 연구동향, 텍스트마이닝,Big data, Pinus densiflora, Research trends, Text mining,빅데이터; 소나무; 연구동향; 텍스트마이닝;Big data; Pinus densiflora; Research trends; Text mining



재료 및 방법
1. 빅데이터 분석 과정 및 체계
2. 웹 크롤링
3. 데이터 전처리 및 분석
4. 단어 빈도수 및 단어 빈도-역문서 빈도 분석(TF-IDF)
5. 단어 간 연결강도 분석(N-gram)
6. 구조적 등위성 분석(CONCOR)
결과 및 고찰
1. 연구논문 추이 및 국가간 연구 현황 분석
2. 단어빈도(TF) 및 단어빈도-역문서 빈도(TF-IDF) 분석
3. 동시출현 단어 분석(N-gram)
4. 소나무에 관한 세부 연구 영역 도출


본 연구는 최근 20년간(2001~2020) 소나무에 관한 주요 연구 주제 및 연구영역 분석을 통한 향후 연구 방향성을 파악하고자 하였다. 이를 위해 Python.3.9.0과 Textom를 활용하여 RISS와 Web of Science의 소나무 관련 총 3866편의 논문 제목과 키워드 데이터를 수집하고 분석을 실시하였다. 분석 결과, 국가별 총 논문 수는 일본 383편(46.8%), 한국 363편(44.4%), 중국 78편(9.5%)순으로 소나무 자생국가를 중심으로 한 관련 연구들이 활발히 진행되었다. 단어 빈도 및 TF-IDF, N-gram, CONCOR 분석을 통해 국내와 국외에서 소나무 관련 주요 연구 주제는 소나무재 선충으로 나타났으며, 사회 및 경제적 환경, 관련 정책 등 차이에 의해 국내와는 달리 국외에서는 '균근' 관련 연구가 주요 연구 영역으로 도출되었다. 또한 소나무 관련 연구는 일부 인문 사회학적인 연구들이 진행되었지만 주로 생태적인 측면에 집중되어 있는 것으로 나타 났다. 이에 소나무의 인문·사회학적 가치를 고려할 때 향후 연구에서는 이와 관련 후속연구가 필요할 것으로 판단된다.

The purpose of this study is to analyze domestic and foreign research trends and future direction of Pinus densiflora in recent 20 years using text mining. A total of 3866 academic papers related to Pinus densiflora were collected by the ‘RISS’ and‘WOS’ and the collected data is analyzed by Python 3.9.0 and UCINET. The findings of this study show that academic papers on the theme of Pinus densiflora with the ranking of Japan (383 papers, 46.8%), the Korea (363 papers, 44.4%), U.S. (78 papers, 9.5%) and so on. This result indicates that researches are the most vigorously conducted in pine tree native nations. From the results of TF, TF-IDF, N-gram and CONCOR analyses. The major research topic was pine wilt disease Bursaphelenchus xylophilus over the past 20 years. The studies related to‘mycorrhiza’were derived as major research subject in foreign than Korea. In addition, some humanities and social studies have been conducted on Pinus densiflora, but they are mainly focused on ecological aspects. Considering the humanistic and social value of Pinus densiflora, it need to expand research topics on humanities and social values.