[LLM] 임베딩 모델로 데이터 의미 압축하기 (1) - 텍스트 임베딩 이해하기
·
AI
컴퓨터가 자연어를 이해하려면 텍스트를 숫자로 바꿔야 하는데, 이 과정에서 '임베딩'이라는 방식이 쓰인다. 오늘은 텍스트를 숫자로 바꾸는 다양한 방법과 그 변천사를 알아보고, 각각의 방식이 어떤 의미를 갖는지 깊게 이해해 보자. 우리가 이걸 왜 알아야 할까? 예를 들어 검색 엔진에서 적절한 답을 찾으려면 질문과 정보의 의미적 유사성을 계산해야 하는데, 여기서 임베딩이 핵심적인 역할을 한다. 추천 시스템이나 자연어 처리에서도 마찬가지로 중요하다. 결국 이런 과정을 제대로 이해하면 단순히 모델을 사용하는 데서 그치지 않고, 데이터를 다루고 의미를 압축하는 구조를 설계하는 데까지 응용할 수 있게 된다. 텍스트 임베딩 from sentence_transformers import SentenceTransformer..
아저씨 넷의 당일치기 대구 여행기 근데 1박을 곁들인
·
Life/living
이제 다시는 안 간다... 돌아오는 버스를 네 시간 반이나 타니 허리가 끊어질 지경... 지난번에는 KTX 타고 가서 편했는데 이번에는 버스를 타봤다  이월드 가는 게 목적이라 서대구로 정했고~ 근데 어차피 서대구 들렀다 동대구 가던데 버스 타러 갔는데 진주 가는 버스도 있네? 소도시를 위한 배려인가요?휴게소에서 호두과자 사먹었는데 진짜 맛있더라 김이 모락모락  이월드 도착! 네이버페이로 결제하면 반값이라 24,500원에 들어왔다 근데 신기한 게 다른 조건이 없음! 그냥 네이버페이로 결제만 하면 반값이더라 보이다시피 사람이 진짜 없었다 근데 놀이기구 안하는게 많아서 눈치게임을 막 성공한 건 아닌 것 같은 느낌 부메랑이랑 허리케인 운휴라 나머지만 조지게 탔다  자기랑 닮았다고 주장하는 거 같은데 도저히 봐..
⠀ ⠀ ⠀ ⠀
·
카테고리 없음
⠀ ⠀ ⠀ ⠀
[LLM] LLM Cache로 효율성 확보하기 with ChromaDB
·
AI
지난 시간에는 벡터 데이터베이스를 통해 사용자의 질문과 관련된 정보를 찾아 프롬프트에 통합하는 RAG에 대해 알아보았다. 이제 만들어진 프롬프트를 바탕으로 LLM 모델에 결과를 요청해야 한다. 그런데 여기선 두 가지 상황에서 문제가 발생한다. 먼저 OpenAI 같은 상업용 API를 사용할 경우, 프롬프트의 토큰 수만큼 비용이 발생한다. 그렇다고 직접 LLM을 서빙하는 경우도 녹녹지 않다. GPU를 많이 사용해야 하기 때문이다. 다양한 상황에서 최대한 LLM 추론을 줄여야 할 텐데, 어떤 상황에서 줄일 수 있을까? 그건 바로 이미 이전 상황에서 생성된 답변이 있는 경우를 활용할 때다! 똑같은 질문을 다시 하거나, 비슷한 질문을 했을 때 같은 답변을 내놓는다면 LLM 추론 횟수를 줄일 수 있을 것이다. 이번..
[LLM] RAG로 Hallucination 방지하기 with Llama-index
·
AI
우리는 ChatGPT의 답변을 얼마나 신뢰할 수 있을까? ChatGPT 유료 멤버십을 사용한다면, 보통 ChatGPT 4o 모델을 사용할 테니 웬만한 질문에 대한 답변에서 할루시네이션 (hallucination) 이 일어날 가능성이 상대적으로 줄어든다. 이는 모델이 모르는 정보에 대해 외부 정보를 검색해서 나오는 데이터를 참고하여 답변하기 때문이다. 이 방식은 이후 설명할 RAG와 유사한 방식으로 작동된다. RAG (Retrieval-Augmented Generation) RAG는 한국말로 검색 증강 생성이다. 검색 증강 생성이란, LLM이 질문에 대한 답변을 확률에 기반한 생성에 집중할 뿐만 아니라 답변에 필요한 충분한 정보와 맥락을 제공하고 답변하도록 하는 방법이다. 말 그대로 검색을 통해 보충한 생..
[Dev, iOS] iOS 18+에서 앱 아이콘 커스텀하기 Any, Dark, Tinted
·
Dev/iOS
애플의 소프트웨어는 기능적인 부분뿐만 아니라 심미적인 요소에도 상당히 신경을 쓴다. 2017년 출시한 iOS 10.3에서는 앱 개발자가 유저에게 대체 가능한 아이콘 디자인을 설정할 수 있는 기능을 도입하였다. 이로 인해 서드 파티 앱 일부는 사용자가 원하는 디자인의 아이콘을 선택할 수 있었다. 2년 뒤 출시된 iOS 13에서는 새로이 다크모드라는 개념을 도입하면서 한밤 중 쨍한 화면을 봤을 때 느끼는 불편함과 동시에 기존에 어둡게 화면을 사용하는 유저들의 니즈도 만족시켰다. 하지만 단일 앱 아이콘 디자인을 제공하는 서드 파티 앱의 앱 아이콘을 시스템에서 마음대로 수정할 수는 없었다. 하지만 그로부터 5년 뒤 출시된 iOS 18에서는 (그로부터 다른 여러 커스터마이징 기능이 추가되었지만) 드디어 배경화면에..
[Dev, iOS] Xcode - Missing file libarclite_iphoneos.a 오류 대응하기
·
Dev/iOS
예전에 개발한 앱을 좀 다듬어볼까 하고 오랜만에 빌드해봤는데 갑자기 오류가 딱! 발생했다. 오래돼서 그러려니 하고 Podfile도 업데이트 하고 deployment target 버전도 올리고 ChatGPT가 하라는 대로 별 짓 다해봤는데 해결이 안되더라. 그런데 그냥 스택 오버플로우에 검색해보니 바로 나온다. 기존 Podfile 에 다음 코드를 추가해 준다. post_install do |installer| installer.generated_projects.each do |project| project.targets.each do |target| target.build_configurations.each do |config| config.build_settings['IPHONEOS_DEPLOYMENT_..
[SKT FLY AI Challenger] 5기 수료생의 다음 기수를 위한 궁금한 점, 꿀팁 모음
·
Life
최근 문의도 많이 오고 (거짓말) 댓글도 달리고 해서 (거짓말) 까먹기 전에 꿀팁이나 궁금할 것 같은 점들을 적어볼까 한다 (물 안 들어와도 노 젓기). 주관적이거나 기수별로 상이할 수 있으므로 참고만 하시길 자취, 숙소(24. 11. 11 추가)아마 이 질문이 가장 많았던 것 같다. 아무래도 전국에서 지원을 하고 사옥으로 출퇴근해야 하니 말이다. 나는 본가가 인천이라 편도 1시간 40분 걸려서 왔다 갔다 했었다. 나처럼 멀리 살지만 왔다 갔다 했던 친구는 수원, 고양, 구리 정도였던 것 같다. 서울 끝자락에서 오는 친구들까지 해서 우리 기수는 편도 1시간 40분 정도 걸리는 선이 마지노선이었다. 지방에서 온 친구들은 보통 신림에 단기로 숙소를 임대했다! 끝나고 취준을 이어하는 친구는 반년 정도를 계약했..
100두산
'오블완' 태그의 글 목록