Harheem's Blog

Sign in Subscribe

Text-to-SQL 에이전트만으로 신뢰할 수 있는 숫자를 만들 수 있을까?

Text-to-SQL 에이전트만으로 신뢰할 수 있는 숫자를 만들 수 있을까?

자연어로 질문하면 SQL을 생성하고, 실행하고, 결과를 요약해 주는 에이전트는 이제 익숙한 패턴이 됐습니다. 저도 데이터 에이전트를 설계한다고 하면 가장 먼저 text-to-SQL 구조를 떠올렸습니다. 사용자의 질문을 받고, 관련 schema를 찾고, 필요한 테이블과 컬럼을 고른 뒤 SQL을 생성합니다. 이후 SQL을 실행하고 결과를 다시 자연어로 설명하는 방식입니다. 흐름을 단순화하면 이렇습니다. 사용자 질문 → schema

[논문 리뷰] LLM 내부의 희소 보상 서브시스템: 모델은 답하기 전에 성공 가능성을 알고 있을까?

[논문 리뷰] LLM 내부의 희소 보상 서브시스템: 모델은 답하기 전에 성공 가능성을 알고 있을까?

Sparse Reward Subsystem in Large Language Models를 읽고, 내부 신뢰도 신호를 어디까지 실무에 활용할 수 있을지 정리합니다. LLM의 추론 성능은 빠르게 좋아지고 있습니다. 하지만 모델이 왜 특정 문제를 잘 풀고, 어떤 상황에서 실패하는지는 여전히 설명하기 어렵습니다. 실무에서는 이 문제를 완화하기 위해 모델에게 직접 자신감을 말하게 하기도 합니다. 예를 들어 “이

DeepSeek 이후, 한국 오픈소스 AI 생태계는 무엇을 갖춰야 할까

DeepSeek 이후, 한국 오픈소스 AI 생태계는 무엇을 갖춰야 할까

모델 공개를 넘어, 작동하는 생태계로 2025년 이후 글로벌 오픈소스 AI 생태계에서 가장 큰 변화는 모델 성능 향상만으로 설명하기 어렵습니다. 더 중요한 변화는 오픈소스가 AI 시스템 설계의 기본 전제로 자리 잡기 시작했다는 점입니다. DeepSeek R1 이후 중국 사례에서 확인할 수 있듯이, 모델은 더 이상 완결된 결과물로만 다뤄지지 않습니다. 이제 모델은 재사용하고,

Activation Steering: 미세 조정 없이 LLM의 행동을 제어하기

Activation Steering: 미세 조정 없이 LLM의 행동을 제어하기

LLM이 빠르게 발전하면서 연구와 제품 개발의 관심사는 단순한 성능 향상을 넘어가고 있습니다. 이제 중요한 질문은 “모델이 얼마나 잘하느냐”만이 아닙니다. 모델이 왜 그렇게 행동하는지, 그리고 원하는 방향으로 얼마나 안정적으로 제어할 수 있는지가 점점 더 중요해지고 있습니다. 이 맥락에서 Activation Steering은 흥미로운 접근입니다. 모델을 바깥에서 프롬프트로만 유도하는 방식에서 한 걸음 더

KIRO의 Powers와 Claude의 Agent Skills 비교하기

KIRO의 Powers와 Claude의 Agent Skills 비교하기

에이전트가 단순히 답변을 생성하는 도구를 넘어, 실제 파일을 다루고, 외부 서비스를 호출하고, 배포와 문서 작업까지 수행하는 방향으로 발전하고 있습니다. 이 흐름에서 다시 보게 되는 질문이 있습니다. 에이전트에게 우리 팀의 일하는 방식을 어떻게 가르칠 수 있을까요? AWS Kiro의 Powers와 Claude의 Agent Skills는 이 질문에 대한 서로 다른 접근입니다. 둘 다 파일과

Gemma Scope 2, 대형 언어모델의 뇌를 해부하기

Gemma Scope 2, 대형 언어모델의 뇌를 해부하기

대형 언어모델(LLM)은 이제 단순히 “답을 잘하는 모델”을 넘어, 더 복잡한 판단과 추론을 수행하는 시스템으로 발전하고 있습니다. 하지만 성능이 좋아질수록 더 까다로운 문제가 따라옵니다. 모델이 왜 특정 답변을 했는지, 왜 탈옥(jailbreak) 프롬프트에 취약한지, 왜 실제 reasoning과 다른 Chain-of-Thought를 만들어내는지 설명하기가 점점 어려워집니다. 이 문제를 다루려면 모델의 출력만

HuggingChat의 Omni (Router) 알아보기

HuggingChat의 Omni (Router) 알아보기

요즘 저는 Hugging Face의 'Omni'를 지켜보고 있습니다. 이것은 또 하나의 흔한 챗봇이 아닙니다. 수많은 오픈소스 AI 모델들 사이에서 사용자의 질문(프롬프트)에 가장 적합한 모델을 자동으로 골라 연결해주는 지능형 라우팅 시스템입니다. Omni는 사용자가 어떤 작업을 원하는지 파악한 뒤, Hugging Face의 방대한 라이브러리에서 번역, 코딩, 요약 등 해당

[독서 노트] 공자가 죽어야 나라가 산다 - 김경일

[독서 노트] 공자가 죽어야 나라가 산다 - 김경일

서론: 시대의 금기에 도전한 문제작 1998년, 대한민국이 IMF 외환위기라는 미증유의 국가적 재난 속에서 신음하고 있을 때, 한 권의 책이 사회에 거대한 파문을 던졌다. 바로 김경일의 '공자가 죽어야 나라가 산다'이다. 이 책은 '공자'라는, 한국 정신문화의 근간을 이루는 성인(聖人)의 죽음을 선언하는 도발적인 제목만으로도 엄청난

[EDITOR'S CUT] 책, 끝까지 다 읽어야 할까? 생성 AI 요약이면 충분할까?

[EDITOR'S CUT] 책, 끝까지 다 읽어야 할까? 생성 AI 요약이면 충분할까?

[에디터의 노트] 아래는 일본의 저명한 편집자 이와사 후미오(岩佐文夫) 씨가 기고한 칼럼을 번역한 글입니다. 생성 AI 시대의 독서법에 대한 그의 통찰은 매우 시의적절합니다. 저는 이 글이 한국 독자들에게 더 큰 가치를 제공할 수 있도록, 원문의 내용을 해치지 않는 선에서 추가적인 해설과 분석을 덧붙였습니다. 본문에 언급된 책과 핵심 개념에 대한

메타 프롬프팅 마스터클래스 (Meta Prompting Masterclass) 한국어 번역본

메타 프롬프팅 마스터클래스 (Meta Prompting Masterclass) 한국어 번역본

안녕하세요. 글을 작성하는 오늘은 9월 25일입니다. 어제(9월 24일) 래블업의 5번째 컨퍼런스에 다녀왔습니다. 여러 세션 중에서도 최승준님의 [생성형 호기심이 불러일으킨 상상] 발표가 특히 기억에 남았습니다. 이 발표에서 다뤘던 '메타 프롬프팅'이라는 개념을 보다 상세히 다뤄보고자 합니다. 메타 프롬프팅은 생성형 AI의 가능성을 한 단계 더 끌어올릴 이 흥미로운 기법입니다.

Hugging Face Chat Template 정리하기

Hugging Face Chat Template 정리하기

이전에는 대화형 언어 모델의 챗 템플릿(Chat Template)을 확인하려면 Hugging Face 저장소의 'Files and Versions' 탭에서 tokenizer_config.json 같은 설정 파일을 직접 찾아봐야 했습니다. 모델마다 다른 프롬프트 형식을 적용하기 위해 거쳐야 하는 다소 번거로운 과정이었습니다. 최근 허깅페이스 모델 페이지에 이 챗 템플릿을 바로 확인할 수 있는

[독서 노트] 질문의 격 - 유선경

[독서 노트] 질문의 격 - 유선경

문장에 ‘왜’를 넣는다고, 문장 끝에 물음표를 매달아 놓는다고 다 질문이 될 수 없다. '겸손'에 달리지 않았다. 내가 처한 세상을 얼마나 정확하게 알고자 하는지에 달려 있다. 글은 필연적으로 오독의 가능성을 품고 있다. 문해력의 수준이 낮아서 오독하기도 하지만 같은 글을 두고 자기중심적으로 제각각 해석하는 경우가 매우 흔하다. 소크라테스는

Gradio 앱을 MCP(Model Context Protocol) 서버로 실행하기

Gradio 앱을 MCP(Model Context Protocol) 서버로 실행하기

이 가이드는 Gradio 앱을 MCP(Model Context Protocol) 서버로 실행하는 방법을 안내합니다. 핵심은 .launch()에 mcp_server=True를 넣는 것입니다. 나머지는 Gradio가 자동으로 처리합니다. 참고 문서: https://www.gradio.app/guides/building-mcp-server-with-gradio 시작하기 전에 필요 한 것 아직 Gradio가 설치되어 있지 않다면, 아래 명령어로 MCP 관련 기능까지 한 번에 설치할

프롬프트 튜닝 Prompt Tuning 살펴보기

프롬프트 튜닝 Prompt Tuning 살펴보기

Prompt Tuning PEFT(Parameter-Efficient Fine-Tuning)는 적은 수의 파라미터를 학습하는것만으로 모델 전체를 파인튜닝하는 것과 유사한 효과를 누릴 수 있도록 해줍니다. PEFT 방법 중 하나인 Prompt Tuning에 대해서 알아봅시다. 참고 논문: https://arxiv.org/pdf/2104.08691.pdf 프롬프트 튜닝이란? 언어 모델을 특정 작업에 맞게 조정하기 위해 사용되는 기술입니다. 기존의 방식은