Google Colab에서 명명된 엔터티 인식을 위한 BERT 모델 미세 조정

소개하다

명명된 엔터티 인식은 자연어 처리(NLP) 분야의 주요 작업입니다. 일부 텍스트/단어는 다른 것보다 특정 컨텍스트에 대해 더 유익하고 중요하기 때문에 다운스트림 작업에서 추가로 사용하기 위해 텍스트의 엔터티를 감지하는 데 사용됩니다. 이것이 바로 NER를 정보 검색이라고 부르는 이유입니다. 즉, 텍스트에서 관련 키워드를 추출하고 이를 원하는 카테고리로 분류하는 것입니다.

개체명 인식의 도움으로 임상 용어, 약물, 질병 등의 의료 기록에서 일반 및 영역별 사람, 장소, 조직 등을 추출하여 더 나은 진단을 내릴 수 있습니다.

전제 조건

  • Python에 대한 실무 지식 및 Pytorch를 사용한 신경망 훈련
  • Transformer 및 BERT 아키텍처에 대한 지식

추천

출처blog.csdn.net/tianqiquan/article/details/132511363