벤치마크 데이터셋 현황 분석 및 정부 주도의 벤치마크 마련 필요성

벤치마크 데이터셋 현황 분석 및 정부 주도의 벤치마크 마련 필요성 연구 배경 및 필요성 AI 기술의 고도화와 대규모 언어모델(LLM)의 확산으로 모델 출시와 경쟁이 가속화되면서, AI 성능을 공정하고 신뢰성 있게 비교·검증할 수 있는 평가 체계의 중요성이 커지고 있다.특히 자연어 이해·추론·복합 문제 해결 등 정량화가 어려운 능력이 핵심 성능으로 부상함에 따라, 기존 통계 기반 평가 방식만으로는 AI의 실제 역량과 활용 가능성을 충분히 설명하는 데 한계가 나타나고 있다.이러한 환경에서 벤치마크 데이터..

지능사회 이슈분석

Use Cases of Public AI Service, Vol.1 (공공AI서비스 실증사례집 영문본 1권)

공공AI서비스 실증사례집(영문본) 『Use Cases of Public AI Service, Vol.1』 본 보고서는 공공부문 초거대 AI 서비스 개발 사업을 통해 발굴·기획된 과제들을 번역한 영문 자료집입니다. 2022년부터 정부에서 추진한 총 110건의 주요 AI 서비스 실증사례 중, 본 보고서에는 '사회문제 해결'과 관련된 54건의 과제를 수록하였습니다. * '대국민 서비스 혁신' 및 '일하는 방식 개선' 관련 과제는 향후 발간될 후속 권에서 순차적으로 소개될 예정입니다.

ICT 글로벌 동향

KISTEP InI Vol.55 / HAPPY NEW YEAR 2026

KISTEP InI