'AI' 카테고리의 글 목록

AI

검색결과 25 개

🖇️ GraphRAG의 등장 배경바야흐로 대규모 언어 모델, LLM이 등장하여 우리의 일상이 크게 변화하였다. GPT나 LLaMA와 같은 모델들은 사용자의 쿼리를 기반으로 놀라운 수준의 응답을 생성하며 강력한 퍼포먼스를 보이지만, 그와 동시에 치명적인 한계도 가지고 있다. 바로 LLM이 학습 이후 업데이트된 최신 정보들에 대해 무지하고, 학습되지 않은 특정 도메인 지식에 대해 제대로 응답하지 못한다는 점이다. 이러한 한계는 종종 Hallucination이라는 형태로 나타나며, 그럴듯하지만 사실과 다른 답변을 생성하게 된다. 이러한 문제를 보완하기 위해 등장한 것이 RAG(Retrieval-Augmented Generation)이다. RAG의 주요 아이디어는 '지식 검색'과 LLM의 결합이다. 최신 정보..

AI/Trend Review 2025. 4. 18. 00:37

Latent Space의 의미와 활용

🖇️ Latent Space(잠재 공간)의 의미딥러닝에서 고차원 데이터를 저차원으로 인코딩한 Embedding Vector가 매핑되는 공간으로, Embedding Space와 동의어로 사용되기도 한다. 즉, 데이터의 본질적인 특징들만 압축하여 표현한 공간이다. 예를 들어 이미지나 텍스트와 같은 복잡한 입력 데이터를 신경망에 넣으면, 모델은 내부적으로 입력 데이터를 의미 있는 축소된 데이터인 Embedding Vector로 변환하고, 이 Embedding Vector들이 존재하는 공간이 Latent Space이다. 일반적으로 머신 러닝의 맥락에서 Space는 데이터 포인트를 수치적으로 표현하여 매핑하고, 다른 데이터 포인트들과 비교 또는 샘플링하는 공간을 의미한다. Vector로 표현되는 데이터 포인트..

AI/핸즈온 머신러닝 2025. 4. 14. 21:47

순환신경망, RNN(Recurrent Neural Network)

🖇️ 순환신경망, RNN기존의 인공신경망은 한 번에 하나의 입력을 독립적으로 처리하는 구조이기 때문에, 시간에 따른 데이터의 흐름을 처리하는 데에는 한계가 존재한다. 이러한 한계를 극복하기 위해 등장한 모델이 순환신경망 모델이며, 고정 길이의 입력이 아닌 임의의 길이를 가진 시퀀스를 처리할 수 있다. RNN은 시퀀스 모델 중 가장 대표적이고 기본적인 시퀀스 모델으로, 데이터의 순서를 고려하며, 과거의 정보를 현재의 계산에 재귀적(recurrent)으로 반영하는 구조를 가지고 있다. 즉, 이전의 '기억'을 활용하여 다음 작업을 수행할 수 있는 신경망이다. RNN은 시계열 데이터나 자연어, 음성 데이터와 같이 순서가 중요한 문제를 잘 다루며, 자동 번역, Speech to Text와 같은 자연어 처리 작..

AI/핸즈온 머신러닝 2025. 4. 2. 22:17

Model Context Protocol(MCP)란 무엇일까

2024년 11월 25일, AI 회사 Anthropic에서 MCP(Model Context Protocol)을 발표했다. Cursor AI와 같은 회사에서 해당 모델을 채택했으며, 이번에는 OpenAI에서도 MCP를 채택하겠다고 발표했다. 1. MCP의 기본 개념LLM 모델이 외부 도구나 데이터, 기능과 안전하게 상호작용할 수 있도록 설계된 개방형 프로토콜이다. MCP가 등장하기 전에는 각 데이터 소스마다 별도로 커넥터를 개발해야 했다. 예를 들어, AI 비서를 개발하기 위해 이메일, 캘린더, 파일 저장소와 같은 각 서비스마다 개별적인 API를 사용해서 통합해야 했지만, MCP를 도입한다면 표준화된 프로토콜이 이루어지기 때문에 한 번의 통합으로 여러 데이터 소스에 연결이 가능해진다. 활용 예시로, An..

AI/Trend Review 2025. 3. 27. 15:12

[논문 Review] Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture (I-JEPA)

https://arxiv.org/abs/2301.08243 Self-Supervised Learning from Images with a Joint-Embedding Predictive ArchitectureThis paper demonstrates an approach for learning highly semantic image representations without relying on hand-crafted data-augmentations. We introduce the Image-based Joint-Embedding Predictive Architecture (I-JEPA), a non-generative approach for self-suparxiv.org 요약- Latent spa..

AI/Paper Review 2025. 3. 17. 16:51

[DeepSeek]

1. DeepSeek의 개요DeepSeek는 중국의 AI 스타트업인 딥시크(DeepSeek)에서 개발한 모델로, 최근 AI 시장에 혁신적으로 등장하여 많은 관심을 끌고 있다. 기존의 타사 대비 저렴한 비용과 빠른 학습 속도, 그리고 GPU 자원 사용의 효율화 등의 강점을 갖추고 있는 DeepSeek에 대해 간단하게 다루어보고자 한다. 2. DeepSeek의 가격 (작성 중..)참고자료한글과컴퓨터: DeepSeek-R1 기술 분석

AI/Trend Review 2025. 3. 10. 15:02

[Google AI blog] Federated Learning: Collaborative Machine Learning without Centralized Training Data

https://ai.googleblog.com/2017/04/federated-learning-collaborative.html Federated Learning: Collaborative Machine Learning without Centralized Training Data Posted by Brendan McMahan and Daniel Ramage, Research Scientists Standard machine learning approaches require centralizing the training data... ai.googleblog.com Federated Learning은 2017년 구글 AI 블로그에서 공식적으로 소개되었습니다. 아래는 Federated Learning에 대해..

AI/Trend Review 2022. 3. 18. 14:22

[논문 Review] Explaining and Harnessing Adversarial Examples (ICLR 2015)

* 여름 연구실 인턴 정기 미팅에서 논문 리뷰한 것을 정리한 게시글입니다. * 발표 자료는 직접 제작했으며, 사진이나 자료의 출처는 페이지에 바로 표시해두었습니다. * 2021. 07. 21(수) 발표 이번주에 다룬 주제는 적대적 공격, Adversarial Attack에 관련한 논문이다. 먼저, Adversarial Attack이 무엇인지 간단하게 소개하겠다. Adversarial이라는 단어는 대립하는, 적대적인 이라는 뜻을 가지고 있다. Adversarial attack은 사람이 인식하지 못할 정도의 특정 노이즈를 더하여 다른 이미지를 생성하고, 최신 분류 알고리즘들에게 혼란을 주는 공격방식을 의미한다. Adversarial Attack의 대표적인 예시인 판다/긴팔원숭이 사진 예시를 가져와봤다. 사람..

AI/Paper Review 2021. 8. 19. 02:46

[논문 Review] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks (ICLR 2016)

* 여름 연구실 인턴 정기 미팅에서 논문 리뷰한 것을 정리한 게시글입니다. * 발표 자료는 직접 제작했으며, 사진이나 자료의 출처는 페이지에 바로 표시해두었습니다. * 2021. 07. 21(수) 발표 지난 논문 리뷰 글에서 GAN 모델에 대해 다루었는데, 이 때 GAN 모델들의 가장 큰 단점으로 안정적으로 학습되기 어려웠기 때문에 좋은 성능을 얻기 어려웠고, 결과물에 대한 객관적인 평가가 어려웠다는 점을 소개했다. 그렇기 때문에 초기에는 GAN을 응용하는데에 많은 어려움이 있었고, GAN의 단점들을 극복하기 위해 DCGAN이 등장한다. DCGAN이 나온 이후에는 대다수의 GAN 구조는 DCGAN의 구조를 따르고 있다고 하여 의미가 크다고 한다. 이번에 리뷰해볼 논문은 DCGAN을 처음 제안한 Unsup..

AI/Paper Review 2021. 8. 19. 02:21

PREV NEXT

BINABLE

CATEGORIES

AI

NOTICE

ARCHIVE

RECENTPOST

RECENTCOMMENT

티스토리툴바