메뉴 닫기

인공지능(Ai) 신기술의 소개와 활용

안녕하세요. 이번에는 최근 핫한 ChatGPT를 비롯한 인공지능(AI)에 대한
인공지능 기술의 발전과 향후 도전 과제에 관한 주제로 주관적 기준으로 소개하겠습니다. 

최근  it업계에서 큰 주목을 받고있는 신기술이 있습니다. 
바로 인공지능(AI)입니다.

인공지능은 최근 몇 년간 매우 빠르게 발전해 왔습니다.
딥러닝과 같은 기술의 등장으로 인공지능 기술은 이전보다 훨씬 더 높은 정확도와 성능을 보여주고 있습니다.

이러한 발전은 많은 분야에서 혁신적인 변화를 가져왔으며, 특히 의료, 자율주행, 보안, 언어처리 등
다양한 분야에서 많은 기대를 받고 있습니다.

다양한분야에서 최근 주목받고있는 인공지능 2개를 소개하고자 합니다.  
오늘은 이전에 다룬 언어모델 기반인 ‘ChatGPT’와 이미지 기술을 활용한 ‘Novel AI image generation’에 대하여 소개하고자 합니다. 


첫번째로 ChatGPT입니다. ChatGPT는 GPT(Generative Pre-trained Transformer)라는
OpenAI에서 개발한 대규모 언어모델의 하나인 기술을 기반으로 하며,

자연어 처리 및 생성 모델의 분야에서 높은 성능을 가진 모델입니다.
GPT기술을 기반으로 다양한 분야에서 최신 IT기술과 자연어 처리 기술을 통한 사용자 니즈에 맞춰 답변을 제공합니다.

ChatGPU 동작원리

ChatGPU는 자연어 처리 기술 중 딥러닝 기반의 언어모델을 통해 
질문한 키워드에 따라 수 많은 데이터를 기반으로 단어를 예측하는 과정을 반복하며

문장 전체를 생성 또는, 문장의 특정 부분을 추론할 수 있습니다.
※OpenAI GPT-3.5 아키텍처 기반

이해를 위해 예시를 들겠습니다.

사용자  : 질문을 날립니다.
질문  : 서버는 무슨 용도로 많이 사용해? 

ChatGPT : 사용자가 던진 질문을 인식하고 특정 정보일 가능성이 높을 경우 키워드를 분석합니다. 
● 다음으로, “서버“와 “서버의 용도” 키워드를 분석하고 데이터베이스 기반으로 질문이 ‘서버의 용도’를 묻는 것을 확인합니다. 

●  ChatGPT는 방대한 정보 데이터베이스를 검색하고 “서버의 용도”라는 답을 검색합니다

● ChatGPT는 자연어 생성 기능을 통해 변환하여 서버의 용도 및 사용방법에 대한 내용을 출력합니다

※ 자연어 생성기능 : 인공지능 모델이 자연어(사람이 사용하는 언어)를 생성하는 능력 

언어모델 인공지능 장점 

대부분의 질의에 응답합니다.

방대한 데이터를 기반으로 사용자가 원하는 니즈에 맞춰 대답을 추출하는 구조로,
검색엔진을 통한 검색보다 많은 시간을 단축하여 원하는 정보를 뽑아낼 수 있습니다.

언어모델은 대량의 데이터를 인식하여 원하는 정보를 출력하여 효율적인 작업이 가능합니다.
이는 정보탐색에 들어가는 시간을 대폭 줄여주고 작업 효율을 높여줍니다.

언어모델 인공지능 단점

언어모델은 대량의 데이터의 의존도가 매우높습니다.

대량의 데이터베이스 기반으로 가장 답변에 가까운 답을 출력하는 구조로 돌아가므로,
데이터 자체의 품질이 낮다면 정확도가 매우 떨어집니다.

언어모델은 실시간 데이터에 매우 취약합니다.

실시간 데이터의 경우 방대한 량의 자료가 없어 추출이 제한되며, DB를 실시간 업데이트를 진행하지 않을 시
원하는 대답을 출력할 수 없습니다. 


두번째로는 Novel AI Image generator입니다.
ChatGPT가 언어모델 기반의 인공지능이라면,

해당 AI는 NovelAI에서 지원하는 이미지 인공지능입니다.
Novel AI는 GAN(Generative Adversarial Networks)기술을 통해
주어진 입력에 대해 새로운 이미지를 생성하는 방식으로 작동합니다.

GAN 기술관련 디테일한 설명을 하단에서 이어서 말씀드겠습니다. 

예시


GAN은 (Generative Adversarial Network)의 약어로, 생성 모델과 판별 모델 두 개의 모델이
서로 대립(Adversarial)하면서 학습하는 딥러닝 알고리즘입니다.

GAN은 생성자(generator)와 판별자(discriminator)라는 두 개의 신경망 모델을 이용하여 이미지를 생성합니다.
생성자는 랜덤한 노이즈 벡터를 입력받아 이미지를 생성하고, 판별자는 생성된 이미지와 실제 이미지를 구분하여 정확도를 평가합니다.

이 과정에서 생성자는 판별자의 오차를 최소화하도록 학습하며,
판별자는 생성자가 생성한 이미지를 실제 이미지와 구분할 수 있도록 학습합니다.


이러한 과정을 반복하면서 생성자는 점차 실제 이미지와 유사한 이미지를 생성할 수 있게 됩니다. 

생성자와 판별자는 서로 경쟁하면서 더 좋은 이미지를 생성합니다. 

※ 생성 모델 : 랜덤 노이즈와 같은 입력으로부터 실제와 같은 데이터를 생성하는 역할 
※ 판별 모델 : 생성된 데이터와 실제 데이터를 구분하는 역할
※ 랜덤 노이즈 : 데이터 생성에 사용되는 입력 신호 중 하나. 일반적으로 0에서 1 사이의 균일 분포에서 추출된 난수

GAN(Generative Adversarial Network) 계산식 

생성자와 판별자는 서로 경쟁을 통해 학습하는 방식입니다.
생성자와 판별자는 손실 함수(loss function)를 최소화하거나 최대화 함으로써 학습됩니다.

※ 손실 함수(loss function) : 학습된 모델이 예측한 결과값과 실제 정답(target)값과의 차이를 측정하는 함수

● 생성자 : 손실 함수를 최소화하여 이를 통해 생성된 이미지가 실제 이미지와 최대한 비슷해지도록 생성합니다. 
● 판별자 : 손실 함수를 최대화하여 이를 통해 생성된 이미지가 실제 이미지와 구별되도록 하기 위해서입니다

아래는 계산식에서 사용하는  용어를 정리해보겠습니다. 

●   G  = 생성자 (Generator)
●   Z  = 벡터 (vector)
●   D =판별자 (Discriminator)
●   X = 사실 데이터 (real data)
●   X_fake = 가짜 데이터 (Fake Date)
●   Y_pred = 예측값 (predicted value)

생성자(Generator)는 잠재 공간(latent space)의 무작위 벡터를 입력 받아 가짜 이미지를 생성합니다.

계산식 =  G(z) = x_fake

판별자(Discriminator)는 실제 이미지(x_real)와 생성자가 만들어낸 가짜 이미지(x_fake)를 입력 받아,
실제 이미지일 경우 (1)을, 가짜 이미지일 경우 (0)을 출력을 반복하면서 학습합니다. 

계산식 = D(x) = y_pred   
※ y_pred는 0~1사이의 값을 가집니다.

이미지 인공지능 장점 

창작물을 만드는 시간이 매우 단축됩니다.

머릿속으로 생각하는 이미지나 아이디어를 실시간으로 생성을 통해 복잡한 과정을 스킵할 수 있습니다.
또한, 기존 그림이나 사진의 스타일을 최대한 따라가면서 새로운 이미지를 창조할 수 있습니다.

이미지 인공지능 단점

대규모 이미지 생성을 위해서는 많은 컴퓨팅 자원이 필요합니다.

이미지 생성에 사용되는 사실 데이터 모델은 저작권과 도덕적 문제로 문제가 발생할 가능성이 있으며,
또한, 생성된 이미지가 실제 모델과 비슷하게 묘사될 경우, 불법적인 요소가 포함될 수 있습니다.

AI발전에 따른 최신 기술동향에 대하여 소개를 마칩니다.

긴 글 읽어주셔서 감사합니다. 

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x