☞ https://ya-n-ds.tistory.com/463972 ( IT 이슈 - 반도체 )
☞ https://ya-n-ds.tistory.com/463978 ( IT 이슈 : HBM, SOCAMM )
☞ https://ya-n-ds.tistory.com/463820 ( IT 이슈 : CXL )
☞ https://ya-n-ds.tistory.com/463892 ( IT 이슈 - HBF )
☞ https://ya-n-ds.tistory.com/3064 ( IT 이슈 : AP chip, 모뎀칩 )
☞ https://ya-n-ds.tistory.com/2986 ( IT 이슈 )
☞ https://ya-n-ds.tistory.com/4410 ( 빅데이터 - 머신러닝, AI, etc. )
☞ https://ya-n-ds.tistory.com/4271 ( chatGPT 챗지피티 )
☞ https://ya-n-ds.tistory.com/463708 ( Deepseek )
☞ https://ya-n-ds.tistory.com/463856 ( 피지컬 AI )
☞ https://ya-n-ds.tistory.com/3436 ( 미중 IT 전쟁 )
☞ https://ya-n-ds.tistory.com/4350 ( 화웨이 Way - '메이트60', 메이트XT, AI )
"엔비디아 : 암페어(2020, A100) -> 호퍼(2022, H100) -> 블랙웰(2024, B100) -> 루빈(2026) -> 루빈울트라(2027)"
"인텔 : 가우디2(2022) -> 가우디3(2024)"
"구글 TPU : Trillium(2024) -> Ironwood(2025)"
"테슬라 : AI4(2021) -> AI5(2026) -> AI6"
"NPU와 GPU의 가장 큰 차이는 연산 방식 : GPU는 행렬을 조각 단위로 쪼개 병렬 연산, NPU는 행렬 전체를 한꺼번에 계산"
머스크 "3년뒤 메모리 부족·지정학 위험…美서 칩 생산해야"(종합2보)
테슬라 실적콜서 자체 칩 공장 '테라 팹' 건설 계획 거듭 강조
테슬라, xAI에 20억달러 투자…"올해 설비투자 200억달러 초과 예상"
지난해 연간 매출 '사상 첫 감소' 3%↓…4분기 실적은 전망치 상회
"한국서 FSD 출시 이후 한달 만에 총 주행거리 100만㎞ 넘어"
https://v.daum.net/v/20260129102435270
( "AI 칩 없이는 옵티머스가 마치 '오즈의 마법사'에 나오는 깡통 인간처럼 쓸모없어진다. 테슬라에는 정말 생존이 걸린 문제" )
퓨리오사AI, NPU 'RNGD' 양산 돌입··· '한국 넘어 세계시장 향한다'
https://v.daum.net/v/20260128105106351
( 표준 환경에서 GPU 기반 시스템 대비 2.5배 높은 ‘랙당 연산 밀도(throughput per rack)’를 제공 )
젠슨 황의 '신비로운' 메모리 플랫폼…삼성·SK 기회 잡나
https://v.daum.net/v/20260124152324772
( 'Inference Context Memory Platform'
* Key : 문맥과 답변의 주어와 목표가 무엇인지 파악
* Value : 답에 대한 가중치를 매기고 추론하는 데 필요한 각종 데이터
- KV 생성 GPU + KV 사용 GPU
- ICMS : DPU + Storage )
"엔비디아, AI 추론 스타트업에 2천200억원 투자"
https://v.daum.net/v/20260121154841967
( "그래픽처리장치(GPU) 중심의 학습 시장이 추론 및 저전력 특화 칩 중심으로 이동하면서 NPU가 기술적 대안으로 급부상"
"사우디의 경우 지난해 그록 7천500억 원, UAE는 세레브라스의 1조5천억 원 규모 칩을 구매했는데 작년 리벨리온의 정부 매출은 70억원"
“엔비디아에 지출하는 10분의 1의 예산이라도 국산 AI 칩 대규모 실증과 실증 인프라 구축에 쓰게 해달라” )
엔비디아 야심…‘그록’에 29조 쏟아부은 이유
https://v.daum.net/v/20260120092212832
엔비디아, AI 추론 병목현상 줄이는 스토리지 플랫폼 공개
[CES 2026] 블루필드4 DPU로 추론에 필요한 캐시 데이터 전송 최적화
https://zdnet.co.kr/view/?no=20260106123734
( '추론 컨텍스트 메모리 스토리지 플랫폼' : 키밸류 캐시를 담아 둘 수 있는 전용 인프라를 제공해 랙 스케일 AI 시스템 전반에서 컨텍스트 데이터를 효율적으로 활용
- 이전 : 추론을 실행하는 GPU와 연결된 메모리에 컨텍스트 데이터를 키밸류(KV, 핵심값) 캐시 형태로 담아 활용 )
젠슨 황 “이것이 슈퍼칩 베라루빈” 전격 공개…“실물 AI ‘챗GPT 순간’ 왔다”
https://v.daum.net/v/20260106115522457
( ‘베라 루빈 NVL72’ = 36개의 중앙처리장치(CPU) ‘베라’ + 72개의 그래픽처리장치(GPU) ‘루빈’
-> 기존 ‘그레이스 블랙웰’ 기반 제품과 비교해 추론 성능은 5배 향상, 토큰당 비용은 10분의 1 수준
* 자율주행 차량 플랫폼 ‘알파마요(Alpamayo)’ : 파운데이션 모델 ‘코스모스’와 연계 - 향후 발생할 상황을 추론해 동작
* 로봇 구동용 모델 ‘그루트(GROOT)’, 시뮬레이션 플랫폼 ‘아이작 심’ )
---
