Crowdstrike 경험
EDITDELETEREPLY
2024-07-1911:55:37#3879991
YARN 140.***.198.159 41
잘 알려진 인터넷 회사에서 일하는데, 예전에 모든 서버 (우리는 모두 Linux임)에 Crowdstrike를 설치해 돌리라는 “명령”이 떨어졌다. 해킹 피해를 본 적이 있었는데, 유저들과 법정에서 세틀하면서 이런 종류의 오딧이 법적으로 강제화된 것이었다.
당시 Crowdstrike는 윈도우즈용으로 개발하여 이제 막 리눅스쪽 프로덕트를 내기 시작한 때였는데, 얘네 소프트웨어가 설치되면 심각한 성능 저하와 크래쉬하기도 하는 문제가 발생하였다. 우리팀만 해도 대형 서버가 5만대 쯤 되는데, 참으로 심각한 문제였다. 그러나 우리는 단순 app 엔지니어가 아니라, 오에스 디자인을 했던 그루들이 포진하고 있었던지라(본좌도 사실 모회사 리눅스 커널팀 출신) 자세한 시스템 분석을 하고 Crowdstrike에 닥달을 했다.
이례적이었지만, 우리팀의 최강 고수 한 명이 Crowdstrike 본사에 직접 가서 closed room에서 그들의 리눅스 커널 모듈 코드를 리뷰하는 지경에 이르렀다. 그의 말에 따르면 걔네 코드는 허접 그 자체였다고. 커널을 건드려서는 안될 수준의 애들이 쓴 코드라고 했다. 최대한 커널 스페이스의 위험한 코드를 제거하도록 했다. 그러나, 결국 여러가지 이유로 2년 정도 후에 Crowdstrike와는 연을 끊고 다른 경쟁사 제품으로 갈아탔다. 여전히 문제가 발견되었지만, 대응은 그런대로 빨리해주고 무엇보다 가격이 싸서… 우리는 비록 윈도우즈는 쓰지 않지만, 그 때 한 경험을 생각하면 이번에 일어나 사태가 크게 놀라울 것도 아니다.
사람들은 안정적으로 돌아가는게 쉽게 얻어지는 정상적 상태라고 생각하지만 전혀 그렇지 않다. 자연스럽고 있는지 모르게 돌아가는 것들은 모두 엄엉난 내공과 기술이 끊임없이 투입되고 있는 것들이다. 동시에 비지니스를 돌리는 결정권자들은 끊임없이 비용을 줄일 궁리를 하고, 기술에 대한 이해없이 무리하게 비용을 줄이는 짓을 자주 한다. 보잉 비행기의 결함 문제도 그런 결과이다.
이렇게 언제든 인간의 욕심이나 실수로 무너져버릴 수 있는 것들에 완전히 의존하게 되고, 그 위에 계속 탑을 쌓게 되면 망하는 것은 정해진 결과이다. AI의 가장 큰 위험성도 여기에 있다. 잘 이해 못하면서 비용 절감에 좋다고 의존하다가 어느날 사회 전체가 큰 봉변을 당하는 것이다. 이런 일들은 어처구니 없이 작은 것에서 나온 것으로 보이겠지만, 사실은 수많은 워닝과 반대를 무릅쓰고 강행한 (무식한) 결정들의 파급 효과인 경우가 대부분이다.