최근 수정 시각 : 2025-03-27 14:11:14

다크버트



파일:S2W_로고_화이트.svg
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
<colbgcolor=#003295><colcolor=#fff> 제품 SAIP · XARVIS(자비스) · QUAXAR(퀘이사)
홈페이지 파일:홈페이지 아이콘.svg | 파일:LinkedIn 아이콘.svg | 파일:페이스북 아이콘.svg | 파일:유튜브 아이콘.svg
}}}}}}}}} ||
<colbgcolor=#050405> DarkBERT
S2W
파일:다크버트.png
<colcolor=#fff> 국가
#!if 행정구 == null && 속령 == null
[[대한민국|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일:대한민국 국기.svg|width=24]]}}} {{{#!if 출력 == null
대한민국}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 속령 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 특별행정구기.svg|width=24]]}}} {{{#!if 출력 == null
행정구}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 행정구 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 기.svg|width=24]]}}} {{{#!if 출력 == null
속령}}}{{{#!if 출력 != null
}}}}}}]]
|
#!if 행정구 == null && 속령 == null
[[미국|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일:미국 국기.svg|width=24]]}}} {{{#!if 출력 == null
미국}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 속령 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 특별행정구기.svg|width=24]]}}} {{{#!if 출력 == null
행정구}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 행정구 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 기.svg|width=24]]}}} {{{#!if 출력 == null
속령}}}{{{#!if 출력 != null
}}}}}}]]
|
#!if 행정구 == null && 속령 == null
[[일본|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일:일본 국기.svg|width=24]]}}} {{{#!if 출력 == null
일본}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 속령 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 특별행정구기.svg|width=24]]}}} {{{#!if 출력 == null
행정구}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 행정구 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 기.svg|width=24]]}}} {{{#!if 출력 == null
속령}}}{{{#!if 출력 != null
}}}}}}]]
언어 한국어, 영어, 일본어 지원
링크 KO 파일:홈페이지 아이콘.svg | EN 파일:홈페이지 아이콘.svg | JA 파일:홈페이지 아이콘.svg

1. 개요2. 특징3. 기타

1. 개요

DarkBERT

세계 최초의 다크웹 특화 언어 모델. 다크웹 내 위협 분석과 사이버 범죄 탐지에 최적화된 것이 특징이다. S2WKAIST가 공동 개발했으며, 멀티도메인 교차분석 기술과 결합되어 다크웹뿐만 아니라 표면 웹, 소셜 미디어, 다크웹 포럼 등 다양한 출처의 데이터를 연계 분석할 수 있다. 이를 통해 단편적인 정보 분석을 넘어 위협 행위자의 활동 패턴과 연관성을 효과적으로 파악할 수 있다.

DarkBERT 관련 연구는 ACL 2023[1]과 NAACL 2022[2]에서 발표되었으며, 다크웹 데이터를 활용한 언어 모델 구축과 활용 방안을 다뤄 국제 학회에서 기술력을 인정받았다.

2. 특징

기존 언어 모델들이 다루기 어려운 익명성과 구조적 다양성을 가진 다크웹 콘텐츠를 이해할 수 있도록, 고품질 다크웹 코퍼스를 기반으로 RoBERTa 구조를 추가 학습했다. 이로 인해 일반 언어 모델과 차별화된 도메인 특화 자연어 처리 성능을 제공한다. 즉, 다크웹 뿐만 아니라 기업 내외부의 정형 및 비정형 데이터 분석이 필요한 경우에도 활용된다.

3. 기타

  • DarkBERT는 BERT 기반 구조를 바탕으로, 다크웹 데이터를 이해하고 분석하기 위해 특화된 언어 모델이다. ‘Dark’는 다크웹이라는 특정 도메인에 초점을 맞춘 학습 배경을 반영한 명칭이라 한다.
  • S2W는 해당 기술력을 기반으로 국제형사경찰기구(인터폴)의 공식 파트너로 협력하고 있다.

[1] Association for Computational Linguistics 2023, 세계적인 자연어 처리 학술대회[2] North American Chapter of the Association for Computational Linguistics 2022, 북미전산언어학학회