When people learn something new, fascinating things happen.
We don’t usually start completely from scratch—what we’ve already learned naturally becomes a stepping stone.

For instance, someone who’s played the piano can pick up the guitar more easily, thanks to their sense of rhythm and harmony. Logical thinking habits from studying math often become a big help when learning to code later on. And perhaps most importantly, knowledge we picked up long ago doesn’t completely disappear—it lingers, waiting to be brought back when needed.

I think these behaviors reveal something fundamental about intelligence. In everyday life, we extract meaningful and useful information from one task and then reuse it to solve other tasks—that’s essentially what we call insight.

Reinforcement learning has shown impressive performance on learning a single task, but solving a wide variety of complex long-horizon tasks still seems like an open problem. That’s why I’m particularly interested in skill-based RL and representation learning for RL. I believe this direction can both improve model efficiency and move us closer to truly general AI agent.

Ultimately, I’d like to build a home servant agent that can handle everything else, so that I’m free to focus only on the things I really want to do. :)

I’d love to share and exchange ideas on this journey!


사람이 무언가를 배울 때 일어나는 일은 꽤 흥미롭다고 느낍니다.

우리는 새로운 걸 처음부터 완전히 따로 배운다고 느끼지 않습니다. 예전에 익힌 기술이나 경험이 자연스럽게 발판이 되죠. 예를 들어, 음식을 좋아하는 사람은 요리를 빠르게 배웁니다. 요리를 좋아하는 사람은 와인과 커피도 빠르게 배울 수 있구요. 수학에서 논리적으로 사고하는 습관은, 나중에 코딩을 배울 때도 큰 도움이 됩니다. 무엇보다도 우리는 오래 전에 배운 자전거 타는 법은, 긴 시간이 지나도 조금만 페달을 밟으면 스스로 넘어지기 어려워집니다.

이러한 모습들에서 지능의 본질 중 하나를 잘 드러내고 있다고 생각해요. 우리가 일상적으로 어떤 과제에서 의미있고 유용한 정보를 얻고 그것을 다른 과제에서도 활용하는 것, 아마 우리가 "통찰력"으로 부르는 대상 같습니다. RL은 하나의 task를 학습하는 데 매우 뛰어난 성능을 보였지만, 다양한 환경에서 다양한 task를 풀어내는 것은 여전히 열린 문제로 보입니다. 그래서 Skill based RL과 Representation Learning에 관심을 두고 있어요. 저는 이 주제가 모델의 효율을 늘리면서 정말 다재다능한 AI를 만들어낼 수 있을거라고 생각해요.

최종적으로 home servant Agent를 만들어서 제가 하고싶은 일만 할 수 있으면 좋겠습니다 :)

같이 이야기 할 수 있었으면 좋겠어요!


Hobby...

What I am reading...

Location