요즘 인공지능(AI)과 외계지능(Extraterrestrial Intelligence, EI)이라는 두 가지 매우 다른 유형의 지능이 화두가 되고 있습니다. 하나는 실용적이고, 다른 하나는 실존적입니다. 이러한 차이점에도 불구하고, 둘 다 핵심은 답을 찾는다는 것입니다.
그 해답은 분석과 데이터 그리고 데이터가 관리 및 저장되는 방법에 달려 있을 수도 있습니다. 심우주 이미지, 물리학 실험, 전자기 전파, 가청 초음파 데이터 등 우주 탄생의 비밀을 풀기 위해 어떤 방법이 사용되고 있는지 살펴보겠습니다.
빅데이터를 통한 빅뱅 설명
데이터는 수십 년 동안 빅뱅 이론, 반물질 이론, 블랙홀, 다른 차원 등 우주의 현상을 설명하는 데 사용되어 왔습니다.
유럽 입자 물리 연구소(CERN)는 빅뱅과 관련된 입자 실험의 선두주자입니다. 세계에서 가장 강력한 CERN의 대형 강입자 충돌기(LHC, Large Hadron Collider)는 우주의 기원을 밝혀줄 열쇠가 될 수 있습니다. 복잡한 시뮬레이션과 모델, 비감독 머신러닝 기술, 이상을 탐지할 수 있도록 훈련된 신경망이 함께 ‘새로운 현상’을 찾는 데 사용되고 있습니다.
LHC를 가동하면 1년에 1엑사바이트(1,000페타바이트에 해당) 이상의 데이터가 액세스(읽기 또는 쓰기)됩니다. – CERN
이 과정에서 LHC는 분석할 수 있는 엄청난 양의 데이터를 생성합니다. 실제로 입자가 가속기에서 초당 약 10억 번 충돌하면, 초당 약 1페타바이트의 충돌 데이터가 생성될 수 있습니다.
엑사바이트급 데이터가 어떻게 우주의 기원에 대한 인사이트로 전환될까요? 먼저 CERN 데이터센터에서 대규모 데이터 필터링이 시작됩니다. 방대한 규모의 이 데이터센터는 과학 데이터 관리와 운영의 핵심으로, LHC의 배후에 있는 분산 컴퓨팅 인프라가 포함됩니다. (최근에는 CERN의 양자 컴퓨팅 이니셔티브(Quantum Computing Initiative)를 지원하고 있습니다.) 필터링되고 재구성된 데이터는 전 세계 데이터센터로 복사되고 대규모 컴퓨팅 그리드에 분산되어 수천 명의 분석가들이 LHC의 실험을 위해 협력할 수 있도록 합니다.
시간이 지나면서 CERN의 기술이 향상되면 데이터는 계속 증가합니다. LHC의 뒤를 이어 2027년 가동 예정인 고광도(High-Luminosity) LHC는 매년 엑사바이트 규모의 데이터를 생성할 것으로 예상됩니다. 이 때문에 CERN은 현재와 미래의 데이터 문제에 대비를 해야 합니다.
AI를 활용한 외계지능 탐사
2021년 발사된 제임스 웹 우주망원경(JWST)은 이전에는 볼 수 없었던 우주의 모습을 촬영해 전송하고 있습니다. 최근 JWST는 보다 더 야심 찬 목표에 한 걸음 더 다가갔습니다.
JWST는 우주의 기원과 가장 먼 곳에 대한 해답을 찾기 위해 대기를 분석하여 생명체와 첨단 문명의 흔적, 즉 바이오시그니처(biosignatures)와 테크노시그니처(technosignatures)를 찾아낼 수도 있습니다. 즉, 심우주 사진 및 수많은 데이터를 심층적으로 분석할 수 있습니다. (JWST가 발사될 당시 NASA는 데이터 수집 요구량이 5배 증가할 것으로 예상했고, 이에 따라 데이터 인프라를 위해 퓨어스토리지를 도입했습니다.)
연구원들이 장거리 대기 분석 기능을 테스트하기 위해 JWST를 다시 지구로 돌려 보았을 때 놀라운 결과가 나왔습니다. 먼저, 연구팀은 광년의 거리를 시뮬레이션하기 위해 이미지 품질을 낮췄습니다. 그런 다음, 진보된 컴퓨터 모델을 적용해 망원경의 센서를 모방하여 산소, 메탄, 이산화질소 같은 지구의 생체 서명이 탐지되는지 확인했습니다.
그리고 무언가를 발견했습니다! 이는 아직 초기 결과로 확실한 것은 아니지만, 우리가 40 광년 떨어진 곳의 대기를 곧 분석할 수 있을 것이라는 사실은 흥미진진한 가능성입니다.
GPS 데이터로 밝혀지는 암흑 물질
암흑 물질은 그 이름처럼 우주에서 잘 알려지지 않은 원소 중 하나이지만, 원자 시계가 탑재된의 기존 GPS 위성을 사용하면 답을 얻을 수도 있습니다.
이론적으로, 지구를 돌고 있는 GPS 위성과 원자 시계를 사용하면 원자 시계에 영향을 줄 수 있는 ‘글리치(glitch)’의 형태로 통과하는 암흑 물질의 포착할 ‘초정밀 타이밍 신호’를 확보할 수 있습니다. 원자 시계에서 생겨나는 미미한 차이를 AI 기반 이상 탐지로 식별하는 것입니다.
아직 확실하지 않지만, 기존 위성을 거대한 감지기로 사용해 데이터에서 이상을 감지하면 원래 의도하지 않았던 획기적인 발견을 할 수도 있을 것으로 보입니다. 계속 관심을 갖고 지켜볼 만합니다.
사막의 디지털 지문 채취
빛 공해(Light pollution)가 거의 없는 칠레의 아타카마 사막에서는 세계 최대의 전파간섭계 망원경 ALMA(Atacama Large Millimeter Array)가 지구의 대기를 관찰하고 있습니다. 이 전파 망원경은 우주 깊숙이 들여다보며 감마와 전파를 상시 캡처하고 우주의 가장 먼 곳에서 방출된 에너지를 수집하며 해마다 수백 테라바이트의 데이터를 생성합니다. 이러한 ‘디지털 지문(digital fingerprints)’은 입자가 작용하는 원리를 규명해 지구의 기원을 밝히는 열쇠가 될 수 있습니다.
ALMA의 데이터 덕분에, 천문학계는 은하 형성, 별의 형성과 죽음, 블랙홀에 관해 2,500개 이상의 논문을 발표했습니다.
AI와 퓨어스토리지가 우주 탐사를 가속화하는 방법
“머지않아 달이나 화성처럼 지구 밖에서 컴퓨팅 스토리지를 사용하게 되는 날이 오면 퓨어스토리지가 제공하는 기능들이 필요해질 것입니다.” – 론 톰슨(Ron Thompson), 최고 데이터 책임자 겸 디지털 혁신 부책임자, NASA
데이터의 가능성은 퓨어스토리지 같은 데이터 스토리지 기업에게 대단히 흥미롭습니다. 이는 디지털 형태로 표현되는 인간의 호기심과 혁신이라고 할 수 있습니다. 하지만 우주와 마찬가지로 데이터의 양은 방대합니다. 이러한 규모에서 답을 찾아내는 가장 좋은 방법은 AI의 속도, 역량, 규모를 활용하는 것입니다.
이것이 바로 퓨어스토리지가 필요한 이유입니다. 퓨어스토리지는 우리가 살고 있는 지구를 위험에 빠뜨리지 않으면서 이러한 행성 탐사에 힘을 실어 줄 수 있습니다. 고효율 데이터 스토리지 플랫폼을 사용하면, 조직은 높은 성능을 유지하며 사용 편의성과 지속가능성을 실현할 수 있습니다. 데이터 수집에서 분석, 데이터 레이크, 애플리케이션에 이르기까지, 퓨어스토리지의 모든 데이터 수명주기 단계들은 AI에 최적화되어 있습니다.
하늘에서 어떤 일이 일어나고 있는지 주시하며, 퓨어스토리지로부터 더 자세한 정보를 알아보세요.