1. 사전적 의미
Cluster. 군체(群體), 집속체, 무리, 밀접해있는 다수의 무언가를 총칭하는 영단어.2. 저장장치의 논리 단위
컴퓨터 저장장치에서 사용하는 논리적 단위.컴퓨터 드라이브에서 파일을 저장하는 단위로 1개 또는 복수의 섹터로 이루어진다. 작은 파일은 1개, 용량이 큰 파일은 여러 개의 클러스터를 사용하여 저장한다. 여러 개의 클러스터를 사용할 때 반드시 연결되어 있지는 않다. 여기저기 흩어져 있어도 그 위치와 순서를 기록한 FAT에 의하여 관리되므로, 한 번에 파일의 전체 내용을 읽을 수 있다.
파일 시스템 FAT엔트리의 크기에 따라 최대 클러스터 수가 정해진다. 도스 4.0에 처음 도입된 FAT16의 FAT엔트리는 16비트이므로 이론적으로 2의 16제곱, 즉 65536개의 클러스터를 제어할 수 있다. 그러므로 512Byte 크기의 클러스터를 사용하는 경우 약 16MB의 하드디스크를 사용할 수 있다.
윈도우 95에는 기능이 향상된 FAT16이 적용되었고, 윈도우 95 OSR2에서 32비트의 FAT엔트리를 가진 FAT32가 등장한다. FAT32는 16KB 크기의 클러스터를 사용할 경우 이론적으로 4TB(테라바이트)까지 제어가 가능하지만 윈도우에서는 32GB(기가바이트)로 용량에 제한을 두고 있다. 따라서 32GB보다 용량이 큰 디스크를 많이 사용하는 현재에는 FAT대신에 NTFS라는 파일시스템을 많이 쓴다. ReFS는 클러스터 크기를 64KB 까지도 설정 할 수 있으며 NTFS는 2048KB 까지도 가능하다.
클러스터의 크기는 512Byte부터 1KByte, 2KB, 4KB, 64KB 등으로 다양하게 설정할 수 있다. 크면 클 수록 파일 읽기 속도가 빨라져서 성능이 향상되나 너무 크면 작은 파일을 저장할 때 효율이 떨어진다. 예를 들어 클러스터 1개의 크기를 2KB로 설정한 경우라면, 10Byte에 불과한 파일도 2048Byte의 공간을 차지하게 된다. 그리고 구형 운영체제들은 너무 큰 클러스터를 인식하지 못하는 호환성 문제도 있다.
과거에는 512Byte가 대세였으나 현재는 4KB로 잡는 웨스턴 디지털의 어드밴스드 포맷이 사실상 표준으로 자리잡았다.
마이크로소프트에서는 ReFS는 4K, NTFS는 64K에서 성능이 뛰어난것으로 보고있다.# 단 NTFS의 64K 클러스터는 자체 압축기능도 동작 안해서 용량낭비가 심하다고 한다.
3. 컴퓨터 클러스터
고성능 컴퓨팅을 위해 여러 단말의 컴퓨터로 구성된 컴퓨터 집합. 과학, 산업적 용도에서 대형 계산이 필요한 경우, 슈퍼컴퓨터를 대신해서 사용되곤 한다. 기존의 슈퍼컴퓨터의 경우 상당한 고가에 관리 및 이용이 용이치 않다는 단점이 있다. 그러나 클러스터 컴퓨터는 일반적인 컴퓨터를 여러 대 연결해서 구성하는 만큼 저렴한 데다 사용자가 직접 만드는 것도 크게 어렵지 않다는 것이 장점이다. 클러스터 컴퓨터가 계산을 수행하는 방식을 대략 요약하자면,1. 크고 복잡한 계산을 적당한 크기로 나누고 각 노드(Node)에 배분한다.
2. 각 노드들은 계산을 수행한다.
3. 그 결과를 한 컴퓨터(Frontend)에 수합하고 결과를 사용자에게 반환한다.
이것의 반복이다. 물론 실제 계산은 이렇게 단순하지는 않다. 계산 도중 다른 노드에서 수행한 계산 결과를 필요로 할 때가 대부분이기 때문에 각 노드들은 이더넷(Ethernet. 흔히 LAN이라고 부르는 그거)이나 인피니밴드(Infiniband)와 같은 네트워크 장비를 통해서 데이터를 주고 받는다. 병렬적으로 계산한다는 기본 컨셉은 슈퍼컴퓨터와 크게 다르지 않지만, 슈퍼 컴퓨터의 경우, 이런 데이터 통신이 컴퓨터 내부에서 일어난다는 점이 다른 점이라 하겠다. 그리고 각 노드의 계산 성능은 후지더라도 이걸 원기옥 모으듯이 세계구급으로 확장해서 돌리는 게 바로 그리드 컴퓨팅. 자세히 보면 각 노드 사이를 연결하는 네트워크가 인터넷이라는 거 말고는 동일하다.
여기서 클러스터의 단점이 드러나는데, 이런 외부 네트워크를 통한 데이터 통신은 느리기 때문에 여기서 병목 현상이 발생한다. 따라서 단말의 CPU 뿐만 아니라 이 네트워크 장비에 상당히 공을 들이는 경우가 많다. 물론 이것도 어떤 종류의 계산이냐에 따라 다르긴 하다. 분자동역학 시뮬레이션과 같은 경우에는 통신량이 많지 않지만 유체역학 시뮬레이션의 경우, 통신량이 아주 많다. 유체역학 시뮬레이션과 같이 통신량이 많은 경우, 기가비트 이더넷(Gigabit Ethernet)이 아니라 인피니밴드(Infiniband)나 미리넷(Myrinet), 10G 이더넷 등을 쓰기도 한다.
개인적으로 만들어보고 싶다면 라즈베리 파이를 여러 개 사서 만들 수 있다. 실제로 시도해 보는 사람들이 제법 있다. 가성비는 후달리겠지만 이쯤 되면 어차피 진지하게 만드는 물건이 아니니까...
4. 로켓공학 용어
단독으로 사용 가능한 로켓엔진을 여러개 다발로 묶어 큰 엔진 하나만큼의 효과를 내는 기법을 의미한다(클러스터링). 우주개발 초창기에는 미소 우주개발 경쟁기간 동안 추력 큰 로켓엔진을 개발하는 시간보다 두 엔진을 합치는 것이 기술적으로 간편하여 자주 사용되었다(새턴 V 로켓, N1). 소련의 경우 터보펌프 한개로 여러 연소실에 연료를 공급하는 방식의 엔진(RD-170, RD-180)을 활용하였는데, 이는 엄밀히 말해 클러스터링은 아니다. 반면 단독으로 사용 가능한 엔진 5개를 병렬로 연결한 새턴 V 로켓이나 30개 이상을 묶은 N1같은 것은 클러스터링 기술을 활용한 게 확실하다. 소련의 달탐사를 위한 N1로켓이 실패한 것을 생각하면 추력을 높이기 위한 클러스터링이 무조건 좋은 방식은 아니다. 터보펌프와 연소실 같은 진동을 발생시키는 엔진들이 동시다발적으로 작동하면 설계단계에서 알아채기 힘든 공명현상 등에 의해 엔진이 파괴될 수도, 심하면 로켓이 폭발할 수도 있다.한때 델타 4, 아틀라스 로켓, 소유즈의 시대에 클러스터는 사장된 기술이었다. 아틀라스 로켓과 소유즈는 노즐이 많아 클러스터 같아 보이지만 펌프는 하나로 이루어진 단일 로켓 엔진이고, 델타 4의 경우 1단 부스터에 딱 한개의 엔진만 달려 있는걸 볼 수 있다. 이때까지 로켓은 1회용이라는 인식이 강했고, 그만큼 연료 무게 대비 엔진의 무기를 최소화 해야 했기 때문이다. 물풍선에 물을 집어넣을수록 물 무게보다 풍선 껍질 무게가 작아지는 것처럼, 로켓 또한 부품을 간소화하고 한 개의 덩치를 크게 만들 수록 경제적이었다. 클러스터라는 것은 기술력 부족한 국가가 어떻게든 우주로 가보려는(부카니트스) 사파와 같은 기술이나 다름 없었다. 따라서 이때까지는 우주왕복선 같이 재활용 하는 경우가 아니라면 클러스터된 로켓을 찾아보는 것은 매우 어려웠다.
그런데 이러한 클러스터가 지금은 큰 노즐을 개발할 비용을 절약하기 위해 자주 쓰이는 기법으로 자리잡았다. 이러한 이유에는 발상의 전환이 있었기 때문인데, 1:이론이 아닌 실전의 영역에서 규모의 경제를 실현하려는 대량생산제 로켓 엔진이라는 개념을 가져온 사람이 있었고, 2:로켓을 재활용 한다는 개념을 가져온 사람이 있었기 때문이다.
팰컨 9이 대표적인 예시로 무려 9개의 로켓 엔진을 사용하였다. 심지어 팔콘 헤비는 펠컨 9의 부스터 3대를 묶어 총 27개의 엔진을 클러스터링하였다.
누리호의 1단은 2단에 쓰이는 75톤급 엔진 4기를 클러스터링한 설계로 만들어졌다. 다만, 일반적으로 클러스터링을 하면 비행 중 몇 개의 엔진이 고장이 나더라도 문제가 없는 페일 세이프 개념이 적용되는데, 단 4개만 클러스터링 한 경우라면 그러한 이점이 없다. 반면 엔진의 1기 실패가 곧장 로켓 전체의 실패로 돌아가는 확률만 증가할 뿐이다.
5. 확산탄의 명칭
Cluster Bomb. 항공 폭탄 중 여러개의 자탄을 내장하고 있는 폭탄을 뜻한다. 자세한 것은 확산탄 항목을 참조.6. 자동차의 계기판을 부르는 명칭
자동차 카탈로그를 보면 알 수 있지만 계기판을 클러스터라는 말로 설명하고 있다.7. 헛소리 시리즈의 등장용어
헛소리 시리즈의 등장용어. 해악세균, 그린 그린 그린, 우츠리기 가이스케가 팀을 부르는 애칭.8. X 시리즈에 등장하는 카악종족 파이터급 함선
X 시리즈/함선 항목을 참조.