ITZY의 일본 싱글 3집에 대한 내용은 Algorhythm 문서
, BEMANI 시리즈의 수록곡에 대한 내용은 ALGORITHM(BEMANI 시리즈) 문서
참고하십시오.하위 문서: 알고리즘/컴퓨터 알고리즘
#!wiki style="display: inline; display: none;"
, }}}
알고리즘 관련 틀 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
1. 개요
Algorithm | 연산법 演算法문제를 해결하기 위한 절차나 방법. 더 정확한 정의로는, 모든 입력값에 대해 튜링머신이 정지하게 하는 명령.
이 단어는 페르시아의 수학자인 알-콰리즈미(الخوارزمي)의 이름에서 유래했다고 알려졌다.[1] 아라비아 기수법을 나타내는 algorism도 같은 어원을 가진다. 이 때문에 구분을 위해 algorithm 쪽을 '알고리듬'으로 읽는 경우도 있으며#, 실제 영어 발음은 미국식이나 영국식이나 [ǽlgərìðm]('앨거리듬'에 가까움)이나 한국에서는 일반적으론 그냥 알고리즘으로 쓴다.[2] 그런데 algorism 쪽을 뜻으로 풀어 쓰기 때문에 혼동은 없는 편이다.
참고로 algorithm을 알고리즘이라 읽어버리는 이유는 중역의 흔적으로 보인다. 유성음 th(they, the의 [ð])가 일본어에서는 ざ(za)행에 대응되므로[3] algorithm은 일본어로 '아루고리즈무'가 되는데 이를 한국어에 그대로 가져왔다는 것.# 리듬과 똑같은 발음인데 리즘이라 표기하는 것이니 좀 이상한 일이다.[4] 참고로 국립국어원은 알고리듬(Algorithm)과 알고리즘(Algorism) 둘다 표기의 근거가 되는 원어는 다르지만, 같은 어원과 동일한 의미를 지닌 표준어로 인정했다.
알고리즘이라는 용어는 문제를 해결하기 위한 절차나 방법을 의미하는 단어로 넓은 범위에서 사용된다. 조금 더 정확한 의미를 따져보자면 알고리즘은 어떠한 행동을 하기 위해서 만들어진 명령어들의 유한 집합(finite set)이다.
컴퓨터 프로그램은 정교한 알고리즘들의 집합이라고 간주할 수 있다. 수학이나 컴퓨터과학에서 말하는 알고리즘은, 보통 반복되는 문제를 풀기 위한 작은 진행절차(procedure)를 의미한다. 컴퓨터 시대 이후로는 알고리즘이라고 하면 컴퓨터를 통해 실행되는 것이라고 여겨지는 경향이 있으나, 사실 알고리즘 자체는 컴퓨터가 등장하기 이전부터도 존재했다. 즉, 사람이 수동으로 종이를 사용해 일정한 절차로 문제를 풀더라도 알고리즘에 해당한다. 다만, 컴퓨터의 등장과 함께 알고리즘 역시 급속도로 발전하게 된 것은 사실이다. 스택, 큐, 환형 큐, 힙, 트리, 그래프 6가지가 숙지되면 자료구조의 거의 대부분 이해한 것이라 볼 수 있다.
아이러니한 점은, 알고리즘이 문제의 정답을 제시할 필요는 없다는 것이다. 예를 들어, "저게 대체 뭡니까?"란 질문을 들었을 때, "몰라요."라고 답하는 것도 알고리즘이다. 중요한 포인트는 어떤 질문을 받더라도 제한된 시간내에 답을 하는 것이다. 이는 튜링머신에서는 결과값을 반환하지 않더라도, 중간에라도 정지하기만 하면 되는 것과 같다.
2. 알고리즘의 조건
알고리즘은 이하의 요건을 만족해야만 한다.- 입력 - 알고리즘은 0 또는 그 이상의 외부에서 제공된 자료가 존재해야한다.
- 출력 - 알고리즘은 최소 1개 이상의 결과를 가져야한다.
- 명확성 - 알고리즘의 각 단계는 명확하여 애매함이 없어야 한다.[5]
- 유한성 - 알고리즘은 단계들을 유한한 횟수로 거친 후 문제를 해결하고 종료해야 한다. 알고리즘의 한 단계 이후 m의 값은 n 보다 작으며, m != 0[6]이면 n의 값은 다음 번 단계에서 줄어든다.
- 효과성(수행가능성) - 알고리즘의 모든 연산들은 사람이 종이와 연필을 이용하여 유한한 시간 안에 정확하게 수행할 수 있을 정도로 충분히 단순해야 한다.
한편 대니얼 데닛은 자신의 저서 "직관 펌프" 에서 (pp.184-185) 세 가지 핵심 특징을 거론했다.
- 재료 중립성(substrate neutrality) - 알고리즘은 그 절차적 논리에 의해 결과를 도출하며, 재료가 갖는 인과적 힘은 알고리즘의 작동에 어떤 영향도 갖지 않는다.
- 마음 없는 토대(underlying mindlessness) - 알고리즘의 절차는 세분화된 일련의 단계들로 구성되며, 이 각각의 단계들은 별다른 의미해석이 요구되지 않을 만큼 지극히 단순하다.
- 결과 보장(guaranteed result) - 일단 알고리즘의 각 단계들이 실수나 오류 없이 수행된다면, 알고리즘은 최종 단계에서 반드시 성공적인 결과물을 산출한다.
즉, 쉽게 말하면 알고리즘은 어떠한 입력이 있다면 이 입력에 따라 명령을 명확하게 실행하고, 효과적으로 입력에 따른 결과물을 도출 할 수 있다면 알고리즘으로 볼 수 있다는 의미이다. 반대로 명령에 애매함이 있다거나 유한한 시간 안에 끝나는 것이 보장되지 않은 경우를 메서드(Method)라고 한다. 예를 들어 '산에서 길을 잃었을때 계곡을 찾아서 아래로 내려간 뒤 물길을 따라 하류로 가면 된다.' 라는 문장은 메서드이다.
3. 알고리즘의 표현 방법
알고리즘은 크게 3개의 표현 방법을 가진다. 첫번째는 고차원적인 언어로 인간이 이해하기 쉬운 말로 설명되어 있는 형태이며[7], 두번째는 구현 상세 내역이며, 마지막으로는 인간이 꽤 알아듣기 힘든 튜링 머신의 Stable Table이라고 불리는 그림이나 출력물의 형태로 나타내는 방법이 있다.4. 알고리즘의 평가
알고리즘이 위의 조건들을 모두 만족한다면 문제를 풀 수 있다고 할 수 있지만, '효과적으로' 풀어낸다고 할 수는 없다. 위에서 말한 유한한 시간이 몇 달 혹은 몇 년이 될 수도 있기 때문이다. 따라서 우리는 알고리즘을 효율성으로 평가하게 되고, 컴퓨터에서는 시간과 메모리라는 두 자원을 얼마나 소모하는지가 효율성의 중점이 된다.4.1. 시간 복잡도
Time Complexity알고리즘의 소요 시간을 정확히 평가할 수는 없으므로, 자료의 수 n이 증가할 때 시간이 증가하는 대략적인 패턴을 시간 복잡도라는 이름으로 나타내게 된다.[8] 이를 Big-O 표기법(Big O notation)으로 주로 나타낸다. 예를 들어 입력 자료의 크기 [math(n)]에 대하여 [math(\mathcal{O}(n))]의 시간복잡도를 가진 알고리즘은 대략 크기 n에 비례하는 수의 연산을 수행한다고 보면 된다.
알고리즘의 종류에 따라 시간 복잡도의 평가기준도 다양하다. 일반적으로는 [math(\mathcal{O}(n))]의 시간 복잡도를 가지면 좋은 알고리즘으로 취급하며[9][10], [math(\log n)]의 지수승이 붙는 정도로 막으면([math(\mathcal{O}(n \log n))]) 등) 매우 바람직한 결과이다. [math(\mathcal{O}(n^3))] 정도만 돼도 큰 자료수에선 급격히 느려진다.
검색 알고리즘의 경우 [math(\mathcal{O}(1))]이나 [math(\mathcal{O}(\log n))]의 시간 복잡도를 가지는 알고리즘을 선호하고, 정렬 알고리즘의 경우 [math(\mathcal{O}(n \log n))]의 시간 복잡도를 가지는 알고리즘을 선호한다. 여기에 각각 해당되는 자료구조/알고리즘에는 해시 테이블과 퀵 정렬 등이 있다.
이런 식으로 시간 복잡도가 n의 다항식 이하가 되는 알고리즘들을 다항 시간 알고리즘(polynomial time algorithm)이라고 한다. 여기까지만 보면 다항식과는 넘사벽[11]의 증가속도를 자랑하는 [math(\mathcal{O}(2^n))] 또는 [math(\mathcal{O}(n!))] 같은 알고리즘은 매우 막장인 것처럼 보이지만, 세상에는 이런 알고리즘밖에 방법이 없는 어려운 문제들이 수두룩하다. 이런 경우에는 정답을 포기하고 근사해를 구해주는 알고리즘을 찾게 된다.
자세한 내용은 P-NP 문제 문서 참고하십시오.
자세한 내용은 시간 복잡도 문서 참고하십시오.
4.2. 공간 복잡도
Space Complexity공간 복잡도 역시 앞서 언급한 시간 복잡도처럼 Big-O 표기법(Big O notation)을 주로 사용한다. 현실에서는 시간 복잡도보다 중요도는 떨어지는데, 시간이 적으면서 메모리까지 지수적으로 증가하는 경우는 없기 때문이고, 다항 시간 내에서 나타나는 메모리 문제들은 보통 알고리즘 자체보다는 알고리즘의 구현에서 발생하는 문제이기 때문이다.[12] 다만 동적 계획법의 경우에는 메모리가 상당히 많이 필요하기 때문에 (즉, 공간복잡도가 크기 때문에) 입력 값의 범위가 넓으면 사용하지 못하는 경우가 많다. 또한 임베디드, 펌웨어 등 하드웨어 환경이 극도로 한정되어 있을 경우 공간 복잡도도 상당히 중요하게 보게된다. 이론적으로는 n에 대한 다항식만큼의 공간으로도 해결이 안 되는 정말 어려운 문제들[13]을 생각하기도 한다.
5. 주요 알고리즘 종류
- 자료구조 [14]
- 알고리즘 패러다임: 백트래킹, 동적 계획법, 분할 정복 알고리즘, 분기 한정법, 수학적 최적화
- 그래프 알고리즘: 경로 탐색, Union Find, 네트워크 유량(Network Flow) 관련 알고리즘
- 운영체제 분야: 세마포어, 뮤텍스, 식사하는 철학자 문제, 데드락, 멀티태스킹,멀티스레드
- 네트워크 분야 : QoS, 라우팅, 어드레싱[15], 이동성
- 그래프 알고리즘 기반의 최단 경로 탐색: 다익스트라 알고리즘, 벨먼-포드 알고리즘, A* 알고리즘, 외판원 순회 문제, 해밀턴 회로
- 인공지능 분야
- 시뮬레이션 분야 : 몬테 카를로 방법
- 문자열: KMP, Z, Manacher, 라빈-카프 등 및 접미사 배열, LCP 배열, 아호-코라식을 사용하는 알고리즘들
- 컴퓨팅 이론에서 소개하는 모든 알고리즘들.
- 기타 Pollard's rho 등의 정수론 알고리즘, 선형합동법등의 난수발생 알고리즘, 해석기하/그래픽 알고리즘, 유전 알고리즘 기법 등.
- 암호 알고리즘: AES, DES, SEED, 아리아, LEA, MD5, ROT13, 공개키 암호화 방식, 대칭 열쇠 암호, RSA 암호화, 복호화, SHA, 블록체인
사실 수학적인 스킴 혹은 물리학 스킴을 컴퓨터에서 실행해 입력과 출력값이 명확하면 알고리즘이라고 정의할 수 있다. 수치해석, 최적화 이론,통계학, 확률 등을 포함한 수학영역을 포함하면 정의는 끝없이 폭넓어 진다.
6. 알고리즘 경시대회
주어진 문제를 풀며 경쟁하는 것을 CP(Competitive Programming)이라고 하며, 보통 대회 등의 형식으로 치른다. 온라인 대회는 위의 온라인 저지 사이트들에서 자주 열며, 아래는 오프라인 대회의 목록이다.- ACM-ICPC
- SCPC
- 코드그라운드 계정이 있어야 접속할 수 있다.
- Google Code Jam (2003~2023)
- Google Kick Start (~2023)
- Facebook Hacker Cup
- 국제정보올림피아드
- 한국정보올림피아드
- APIO
- NYPC
7. 관련 문서
[1] 대수학을 뜻하는 영어 단어인 algebra 또한 그의 이름에서 유래된 단어이다.[2] 2012년 구글 검색결과 수 "알고리듬" 290,000건, "알고리즘" 4,510,000건.[3] 한때 유행했던 사나와 강남의 발음 언쟁에서 이를 확인할 수 있다.[4] 일본의 아케이드 리듬 게임인 CHUNITHM도 츄니 (중2) + 리듬의 합성어인데 츄니즘으로 읽는다. 일본어 표기의 흔적이라고밖에 할 수 없는 셈.[5] 이 조건에 의해 난수를 사용하는 절차는 알고리즘에 포함되지 않을 것 같으나, 난수의 확률 분포가 가져야 할 특성이 명백하다면 알고리즘에 포함된다.[6] m은 0이 아니다. a != b ↔ b가 고정된 상태에서 a ≠ b를 의미한다.[7] 의사코드(pseudocode)가 이 범주에 들어간다.[8] 자세한 asymptotic이나 O-표기법의 이론은 생략한다.[9] 대부분의 경우 자료를 읽는 데에 어쨌든 [math(n)]의 시간이 필요하므로. 물론 검색 알고리즘에서 [math(\mathcal{O}(n))]은 최악.[10] 물론 [math(\mathcal{O}(1))] 같은 상수항도 있다. 크기에 상관없이 (1을 넣든 10000을 넣든) 특정한 시간 내에 끝낸다.[11] 굳이 표현하자면 n < n log n < n2 < n3 < n4 < (넘사벽) < 2n < (넘사벽) < n! 정도가 되지 않을까.[12] 대표적인 예시는 배열로 구현한 이진 트리로, 편향 이진 트리인 경우 메모리가 지수 단위로 증가하게 된다.[13] 앞에 넘사벽처럼 어렵다고 한 문제들 이상의 우주급 넘사벽이 있다![14] 알고리즘론의 선수과목이다.[15] MAC주소 할당개념도 포함