일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Python
- java
- Packet
- grafana
- CVAT
- kubeadm
- tcp
- Trino
- CSV
- PostgreSQL
- log
- zookeeper
- docker
- aws s3
- AWS
- OS
- Operating System
- Vision
- JavaScript
- ip
- Network
- helm
- airflow
- kubernetes
- Kafka
- MAC address
- jvm
- EC2
- Spring
- kubectl
- Today
- Total
JUST WRITE
[후기 - Udemy] 실전 AI 서비스 기획 Jump into the AI World 본문
실전 AI 서비스 기획 - Jump into the AI World
개발자 글쓰기 커뮤니티인 글또 9기에 참여하고 있습니다.
이번 글또 기수에서는 다양한 혜택이 주어지고 있습니다.
Udemy에서 좋은 강의를 경험해 볼 수 있는 기회가 주어졌습니다.
2가지 강의 선택해서 들을 수 있었고 저는 아래 2가지 강의를 수강하였습니다.
- 기술블로그로 알아보는 테크니컬 라이팅
- 실전 AI 서비스 기획 - Jump into the AI World
이번 포스팅에서는 2가지 강의 중에서 '실전 AI 서비스 기획 - Jump into the AI World'의 후기입니다.
기술블로그로 알아보는 테크니컬 라이팅 후기는 아래 링크에서 확인 가능합니다.
IT 업계의 가장 큰 화두는 AI입니다.
다양한 영역에서 AI를 활용한 서비스를 선보이고 있으며 챗GPT가 나오면서 엄청난 관심을 받고 있습니다.
많은 AI 서비스가 나오고 AI 신기술도 계속 나오고 트렌드도 빠르게 바뀌고 있습니다.
이런 상황에서 제대로 된 AI 서비스 기획하는 것이 중요하다고 판단되었습니다.
마침 수강할 수 있는 강의 리스트에 실전 AI 서비스 기획 강의가 있어서 고민 없이 선택하였습니다.
강의 소개
실전 AI 서비스 기획 강의는 총 7시간 분량의 강의입니다.
제품 개발뿐만 아니라 AI 기본 원리까지 AI 잘 모르는 초보자도 쉽게 들을 수 있습니다.
아래와 같이 5가지 섹션으로 구성되어 있습니다.
- 오리엔테이션
- AI 기술과 흐름
- 제품 개발 A to Z
- AI 서비스 개발 생태계
- Wrap up
주요 부분은 2번째와 3번째 섹션입니다.
2번째 섹션은 AI 기술과 흐름을 예시를 통해 AI 기술에 대해서 잘 모르는 초보자들도 잘 이해하도록 설명해줍니다.
3번째 섹션은 이번 강의의 주제인 AI 서비스 개발을 자세하게 설명해 주는 섹션입니다.
강사
강사는 업스테이지 이활석 CTO님입니다.
네이버 Clova Visual AI 리더 출신으로 글로벌 국제 AI 학회에서 OCR 관련 논문을 10편 이상 게재하신 분입니다.
초보자도 이해하기 쉽게 AI 원리도 예시를 통해 잘 설명해 주십니다.
덕분에 AI 기술을 다뤄본 저 역시 AI 원리에 대해 정리해 볼 수도 있어서 너무 좋았습니다.
AI 기본 원리 이해
강사님께서 AI 기본 원리를 잘 설명해 주셔서 해당 부분을 정리해보려고 합니다.
소프트웨어 개발 방법론에 대해 아래와 같이 소개하고 있습니다.
- SW 1.0 - 규칙 기반 프로그래밍
- SW 2.0 - 딥러닝
- SW 2.0 - 사전학습 & 미세 조정
- SW 3.0 - 초거대 모델
규칙 기반 프로그래밍
가장 초기 개발 방법론인 SW 1.0 버전은 규칙 기반 프로그래밍입니다.
소프트웨어는 입력값이 들어오고 내부 프로그램을 거친 후 출력값을 사용자에게 전달해 줍니다.
규칙 기반 프로그래밍은 개발자가 직접 내부 프로그램을 코딩하는 방식입니다.
모든 경우의 수를 사람인 개발자가 고민해서 프로그램들을 만드는 방식입니다.
딥러닝
두 번째는 SW 2.0 버전 딥러닝입니다.
SW 1.0에서는 내부 프로그램을 사람인 개발자가 직접 개발을 하였습니다.
SW 2.0에서는 프로그램, 연산을 사람이 아닌 기계 즉 AI 모델이 만듭니다.
사람이 아닌 AI 모델이 적절한 연산을 만들기 위해서 필요한 작업이 있습니다.
학습데이터 준비
AI 모델이 연산을 만들기 위한 학습 데이터가 필요합니다.
좋은 데이터를 얼마나 수집해서 학습시킬지가 AI 모델 성능에 중요한 요인입니다.
학습 데이터를 학습시킬 수 있도록 사전 작업이 필요합니다.
데이터에 정답을 부여하는 사전 작업이 필요하며 아래 작업으로 분류됩니다.
- 라벨링
- 어노테이션
시간과 비용이 많이 드는 작업이라 얼마나 효율적으로 학습 데이터를 준비하는지가 관건입니다.
이미지는 픽셀을 통해 특징값을 도출하고 텍스트는 토큰화 과정으로 특징값을 도출합니다.
모델 학습
다음으로 준비한 학습데이터로 AI 모델을 학습시킵니다.
AI 모델은 크게 2가지 모듈로 나눠지게 됩니다.
- 특징 찾기 - 특징을 찾는 연산
- 판단 하기 - 특징을 보고 판단하는 연산
AI 모델은 2가지 모듈이 여러 개로 모여 있는 집합입니다.
모델 학습은 학습 데이터로 다양한 연산들을 시도해서 에러가 가장 적은 최적의 연산 집합을 만드는 작업입니다.
사전 학습 & 미세 조정
SW 2.0 딥러닝 방식은 사람이 아닌 AI 모델이 프로그램을 만들었습니다.
문제는 태스크별로 각기 다른 AI 모델이 필요하였습니다.
사전 학습(Pretraining)
사전 학습은 AI 모델의 2가지 모듈 중 특징 찾기 부분을 재활용해서 효율성을 높이는 작업입니다.
예를 들어 SW 2.0 딥러닝에서는 햄버거와 단팥빵만 구별하는 AI 모델을 학습시켰다면,
사전 학습에서는 햄버거, 단팥빵뿐만 아니라 모든 종류의 빵의 데이터를 AI 모델에 학습시킵니다.
미세 조정(Fine Tuning)
사전 학습한 특징 찾기 모듈은 학습을 하지 않고 그대로 사용합니다.(Frozen)
미세 조정은 판단하는 모듈만 구체적인 태스크에 맞춰서 학습시킵니다.
SW 2.0 딥러닝에서는 태스크별로 특징 찾기와 판단하기 모듈 모두 학습시켜야 했습니다.
사전 학습한 AI 모델을 미리 준비하고 태스크별로는 판단하기 부분만 학습합니다.
사전 학습된 모델만 있으면 필요한 데이터도 적고 개발 속도도 훨씬 빨라집니다.
초거대 모델
GPT3가 나오면서 학습 방법론이 크게 바뀌면서 SW 3.0이 나오게 됩니다.
in-context learning 방식이 나오게 됩니다.
GPT3에서는 원하는 태스크를 설명을 포함해서 입력하면 스스로 파악해서 해당하는 결과를 출력합니다.
사전 학습 모델에 미세 조정을 하지 않습니다.
이런 방식이면 태스크별로 학습 데이터도 필요하지 않고 별도의 학습과정도 필요 없습니다.
초거대 모델이란 단어에서 알 수 있듯이 엄청난 양의 데이터로 학습시킨 거대 모델로 가능한 일입니다.
아래 그림에서 GPT3에서 얼마나 많은 데이터가 학습시켰는지 알 수 있습니다.
수강 후기
강의를 듣고 제가 인상 깊었던 일부분을 정리해서 소개하였습니다.
실전 AI 서비스 기획 강의에 대해서 더 자세히 알고 싶으시면 직접 수강해 보시기를 추천합니다.
AI 기본 원리와 흐름 부분을 머릿속에 정리할 수 있어서 너무 좋았습니다
AI를 잘 모르는 초보자분들도 들을 수 있으니 AI에 관심 있으신 분들은 수강하시길 추천합니다.
[참고사이트]
'ETC' 카테고리의 다른 글
[후기 - Udemy] 기술블로그로 알아보는 테크니컬 라이팅 (0) | 2024.03.24 |
---|---|
[후기 - 코드트리] 절대 가까울 수 없는 존재였던 코테가 다가왔다 (0) | 2024.02.28 |
What is Parquet? (0) | 2022.02.24 |
Git flow (0) | 2021.10.27 |
SVN to Git Migration (0) | 2021.09.21 |