최근 수정 시각 : 2024-10-17 02:20:00

검색 엔진


1. 개요2. 목표3. 기능4. 목록
4.1. LLM4.2. 한국 서비스 중4.3. 해외 서비스 중4.4. 서비스 종료

1. 개요

search engine

월드 와이드 웹 상에 존재하는 정보웹 사이트검색하기 위한 프로그램이다. 웹의 정보를 긁어오는 소프트웨어는 크롤러라고 부르고, 그 행위는 크롤링이라고 부른다. 참고로 일반 검색 엔진에 안 잡히는 웹을 딥 웹이라 한다.

검색 엔진은 프로그램을 가리키는 것이고 그 프로그램으로 검색 서비스를 제공하는 곳은 '검색 사이트'지만, 사실상 검색 엔진이라는 용어로 두 의미를 혼용하고 있다. 또한, 사실상 포털 사이트와 동의어로 쓰이기도 한다. 이는 대부분의 포털 사이트가 검색 서비스를 제공하고 있기 때문이다.

2010년대 들어선 모바일의 강세와 유튜브의 강세로 검색 엔진의 입지가 좁아지는 중이다. 현대 들어서 제대로 된 검색은 구글을 통해 시행할 뿐 대부분의 정보는 검색이 아닌 유튜브나 SNS로 얻는게 대세가 되었기 때문. 네이버는 검색엔진의 힘이 2000년대 비해 보잘것 없다는 얘기를 듣지만 쇼핑[1], 메신저, 웹툰 등을 강화해 좋은 평가를 받고 있는 반면 검색 엔진에 역량을 집중한 바이두는 쇼핑의 알리바바, SNS와 메신저의 텐센트에 비교해 모바일 환경에 전혀 강점이 없다는 평가를 듣고 있다.

그러다 2022년 11월 말 출시된 ChatGPT의 등장으로 대형 언어 모델 기반의 대화형 인공지능 서비스가 주목을 받자 인공지능과 검색엔진을 결합한 AI 검색엔진이 새로운 비즈니스 모델로 떠오르며 또다른 변화를 예고하고 있다. 자세한 내용은 인공지능 검색 엔진 문서 참고.

2. 목표

  • 검색의 품질, 효과성: 사용자가 원하는 정보에 부합하는 정보를 모으는 능력이다.
  • 검색의 속도, 효율: 이름 그대로 검색 속도이다.

3. 기능

  • 색인 과정: 빠른 검색을 위해 색인(Index)이라 하는 키워드를 만들고 정리한다.
    • 텍스트 획득
      • 크롤링
      • 피드 (Feed): 문서를 실시간으로 나열하는 기능.
      • 인코딩
    • 텍스트 변환: 텍스트를 색인어로 변환한다.
      • 파서
      • 불용어 제거
      • 스테밍
      • 링크 추출 및 분석
      • 정보 추출
      • 분류
    • 색인 생성 / 검색 등록: 빠른 검색을 위해 데이터베이스를 만든다.
      • 통계
      • 가중치 부여
      • 인버전
      • 색인 분산
  • 질의 과정
    • 사용자 경험 및 사용자 인터페이스
      • 질의 입력
      • 질의 변환
      • 결과 출력
    • 순위부여: 사용자에 맞게 검색의 우선순위를 만든다.
    • 평가: 품질과 속도를 평가.
      • 로깅
      • 순위부여 분석
      • 성능분석

4. 목록

다른 업체(들)로부터 검색결과를 사온 후 편집하여 보여주는 사이트는 검색 결과를 사오는 회사의 이름을 같이 기재하여 목록에 포함시킨다.

검색 말고도 뉴스, 게임 등 다른 서비스를 제공하는 종합 포털 사이트의 경우 독자적인 자체 검색엔진을 보유한 경력이 있는 경우에만 이 목록에 추가한다. 단, 타 사이트에서 검색결과를 제공받으면 ▩표(타 사이트의 검색결과도 제공받으면 (▩)표)를 한다.

4.1. LLM

4.2. 한국 서비스 중

  • 구글: 전세계에서 가장 많이 사용되는 검색 엔진.
  • 네이버: 한국 1위 검색 엔진. 다양한 정보보단 생활 관련 정보에 특화되었다는 느낌이 있어 전문적이거나 마이너한 주제를 검색할 땐 보통 구글을 사용하는 편이다.
  • Bing: Microsoft Edge의 기본 검색 엔진이다.
  • zum: 영문 검색, 이미지 검색 등 일부 검색은 구글 맞춤 검색을 사용하고 있다.#1#2
  • 네이트▩: 다음으로부터 검색 결과를 제공받는다.[2]
  • 다음(▩): 자체적 검색 외에도 Bing의 검색 결과도 보여준다.
  • 드림위즈
  • 나무위키: 자체적 검색 엔진이 있으며, 크롬과 웨일 브라우저에서 기본 엔진으로 설정이 가능하다.
  • 코리아닷컴
  • DuckDuckGo(▩)
  • Brave Search(▩): 정작 지역을 대한민국으로 설정해도 관련 없는 검색 결과가 표시되는 경우가 있다.

4.3. 해외 서비스 중

  • 구글: 세계 1위 검색 엔진
  • AOL▩: Bing에서 검색결과를 제공받는다.
  • Ask Jeeves▩: 구글에서 검색결과를 제공받는다.
  • Anna's Archive
  • Brave Search(▩): 자체 검색결과를 제공하나, 결과가 존재하지 않을 때 Google Fallback 옵션을 이용하여 구글 검색결과를 받아볼 수 있다.
  • Boodigo
  • Bing
  • Cốc Cốc: 베트남에서 개발된 검색 엔진이자 웹 브라우저다. 비교적 베트남 내에서는 성장이 빠른 편이지만[3] 기본적 데이터의 한계 탓인지 서서히 하락중이다.
  • Disconnect▩: 구글, Bing, 야후에서 검색결과를 제공받았지만 현재 구글은 차단된 상태. Tor 브라우저 기본 검색 엔진.
  • Dogpile▩: 구글, 야후에서 검색결과를 제공받는다.
  • DuckDuckGo(▩): 개인정보를 전혀 수집하지 않는 개인정보 중시 검색엔진. 개인정보 보호에 관심이 많아지는 추세에 전세계 점유율 2위를 찍었다가 다시 4~5위로 내려갔다. Bing으로부터 검색결과를 제공받기도 한다.
  • Ecosia: 검색엔진을 이용한 만큼 나무를 심는 사회적 기업.
  • Gigablast
  • ixquick▩: 구글, 야후, Bing에서 검색결과를 제공받는다. 과거 Tor 브라우저 기본 검색 엔진. 현재 StartPage에 인수됨.
  • Petal Search: 화웨이에서 개발한 모바일용 검색 엔진이다. Petal 어플리케이션을 다운로드하지 않으면 사실상 사용이 불가능하다.
  • Startpage▩: 구글에서 검색결과를 제공받는다. DuckDuckGo와 같은 프라이버시 중시 검색 엔진.
  • Wolfram Alpha
  • 룩스마트: 2015년에는 검색광고 업체로 바뀌었다.
  • 라이코스▩: Bing으로부터 검색결과를 제공받는다.
  • 바이두: 중국의 검색 엔진
  • 얀덱스: 러시아의 검색 엔진
  • 익사이트▩: Dogpile에서 검색결과를 제공받는다.
  • 야후!▩: Bing에서 검색결과를 제공받는다.
  • 야후! 재팬▩: 구글에서 검색결과를 제공받는다.
  • 핫봇▩: 라이코스에서 검색결과를 제공받는다.
  • 엘라스틱 서치: 오픈소스 검색엔진.
  • 웹크롤러: 현재까지 살아남은 검색 엔진 중 최장수 엔진.[4] 소형 검색 엔진으로서는 드물게 자체 엔진으로 서비스 중이지만,[5] 과거 많은 사람들이 찾던 대형 검색 엔진 시절이던 AOL 산하였을 때가 무색하게도 현재는 검색 결과의 퀄리티가 썩 좋지 않아 쓰는 사람이 거의 없기에 운영은 하지만 사실상 운영하는 기업의 실험장 역할이라고 봐야 한다.

4.4. 서비스 종료

  • 한국
    • 까치네
    • 미스다찾니▩: 메타 검색엔진으로 한미르, 알타비스타, 라이코스, 야후!, ....등 다양한 검색엔진에서 결과를 가져왔다.
    • 마이엠
    • 심마니: 천리안에 인수됐고, 천리안도 검색 분야는 사실상 손을 놓은 상황이니...
    • 엠파스: 상기된 네이트와 통합.
    • 야후!: 2014년에 한국 서비스는 종료됐지만, 해외 서비스는 있다.
    • 첫눈
    • 큐로보
    • 코시크: 1995년 서비스를 시작한 최초의 한글 검색엔진.
    • 파란(정보탐정): 한미르와 하이텔이 통합한 사이트였지만, 결국은 사라졌다.
  • 해외
    • Blekko
    • Cuil: 2008년 3300만 달러의 펀딩으로 시작했으나 2년 만에 인수 대상자도 찾지 못하고 서비스가 종료되었다. 흔한 실패 스타트업이 유명해진 이유 중 하나는, Cuil을 "쿨"[6]이라고 발음한다는 점이었다.
    • Infoseek
    • Teoma
    • 와카노: 맨 처음에는 세계로 진출하는 한국 검색엔진이었지만 얼마 안 가 망하고 일본 지사만 남아 지금은 일본 검색 엔진이다. 검색하려 하면 서버랑 연결이 안 되는 건 넘어가기로 하자.
    • 잉크토미
    • 알타비스타

[1] 네이버쇼핑은 네이버페이와 결합해 2020년 현재 한국 2위 인터넷쇼핑 업체로 자리잡았다.[2] 엠파스 인수 시까지만 해도 자체적인 검색 엔진을 보유했었다.[3] 2023년 11월 말에 윈도우 안정 버전이 나왔고, 12월에 베트남 내에서 PC 한정으로 9.24%의 점유율을 달성했다.[4] 단, 자체 홈페이지로 검색 엔진 서비스를 제공한 최초의 기업은 구글이다. 웹크롤러는 처음 시작할 때는 워싱턴 대학교 네트워크 홈페이지 상에서 기능했고, 이후 AOL에 인수된 후로는 AOL의 하위 페이지로 기능하다가, 2001년이 되어서야 자체 홈페이지로 서비스를 제공하였다.[5] 2001년부터 InfoSpace라는 회사가 운영 중인데, 같은 회사에서 운영하는 메타 검색 엔진 MetaCrawler의 경우에는 일찌감치 자체 엔진을 폐기하였고 현재는 Bing에서 검색 결과를 제공받는다.[6] /ˈkuːl/ KOOL 로 발음한다.