요즘 agent 관련해서 이것저것 보다보니, SW, HW 회사 모두 빨리 많은 것들을 준비해야 살아 남을 수 있겠다라는 생각이 많이 들었습니다. 먼저, GPU를 비롯한 많은 infra들이 좀 더 탄탄하게 잘 구축이 되어야 한다고 느낍니다. 아마 시간이 흐를수록 지금보다 더 폭발적으로 workload는 늘어 가겠죠. computing resource 뿐 아니라, memory, network 그리고 storage까지 점차적으로 확장이 되어 갈 것으로 생각합니다. 기존에는 단일 모델의 max throughput 위주의 성능 자랑 위주였다면 이제 점차적으로 agent와 같은 실사용 위주, 서비스 위주로 진행이 되어가면서 KV cache를 비롯해서 폭발적으로 늘어가는 "데이터" 들을 어떻게 전송하고, 보관하고, ..