2024 제1회 D&X:W Conference 개최

학문 간 협력의 장, AI의 최신 기술과 연구를 공유하다

지난 11월 15일(금), 국민대학교 본부관 1층 학술회의장에서 2024 D&X Conference가 성황리에 개최됐다. 이번 컨퍼런스는 AI빅데이터융합경영학과 소속의 빅데이터분석학회 D&A, 인공지능학회 X:AI, 그리고 소프트웨어융합대학의 웹 학술동아리 WINK가 공동 주최한 행사로, AI의 최신 기술과 연구를 공유하며 학문 간 교류와 성장을 도모하는 자리로 마련됐다. 행사에는 AI빅데이터융합경영학과 정여진 주임교수, 이제혁 X:AI 지도교수, 박종혁 D&A 지도교수, 그리고 박하명 소프트웨어융합대학 인공지능학부 교수가 참석해 학생들을 응원했다. . 또한, AI빅데이터융합경영학과와 소프트웨어융합대학 학생회장, 그리고 졸업생도 함께했다. 세 학회의 협업을 통해 열린 이번 행사에서는 다양한 분야에서의 주제가 발표됐다. 행사는 'Tech', 'Research', 'Service' 세 가지 주제로 구성됐으며, AI와 빅데이터가 실생활에 어떻게 적용될 수 있는지를 다루는 발표들이 이어졌다. 그럼 어떤 주제로 컨퍼런스가 진행됐는지 BizOn과 함께 알아보자.

▲ 컨퍼런스 단체 사진

<Tech>

Sketch2Image를 통한 갤러리 내 사진 검색
"마우스와 키보드를 사용하지 않고도 그림을 생성할 수 있을까?"라는 질문에서 출발한 이 프로젝트는 실시간 웹캠 영상을 활용해 손가락 움직임으로 스케치를 생성하는 독특한 기술을 선보였다. 프로젝트에서는 OpenCV와 MediaPipe를 사용하여 손가락 움직임을 추적하고 스케치를 만들어냈다. 이후 BLIP 모델을 활용해 생성된 스케치로부터 캡션을 생성하고, Diffusion 모델을 적용해 고품질 이미지를 생성했다. 특히, 생성된 이미지를 기반으로 데이터베이스에서 유사 이미지를 검색하는 과정이 주목받았다. 시스템은 500장의 이미지를 단 3분 만에 검색할 수 있는 효율성을 자랑하며, 실시간 이미지 검색의 가능성을 시연했다. 발표자는 이러한 기술이 갤러리 관리나 이미지 검색 분야에서의 활용 가능성을 크게 확장할 수 있을 것이라고 강조했다.

Diffusion을 활용한 상품 맞춤형 광고 스토리보드 생성
광고 제작 과정의 초기 단계를 자동화하고 창의적인 아이디어를 효율적으로 제안하는 시스템이다. 품목명과 특징을 텍스트로 입력하면 Stable Diffusion XL을 활용해 높은 품질의 이미지를 생성하며, 번역 및 요약 단계를 통해 광고 스토리보드가 자동으로 제작된다. 해당 시스템은 텍스트 데이터를 기반으로 창의적인 아이디어를 도출하는 데 있어 한국어와 영어를 모두 지원하며, 한국어 표현에 중점을 둔 모델인 BLLossom을 활용했다. 데모에서는 사용자가 간단한 입력만으로 장면별 스토리보드를 생성하는 모습을 보여주며, 광고 제작 초기 단계의 효율성을 극대화했다. 향후 데이터셋 확장과 모델 튜닝을 통해 더욱 세밀한 이미지 표현과 통일성을 높일 계획임을 발표했다.

Table-to-Text: A New Way of Information Extraction
테이블 데이터를 자연어로 변환하여 보다 직관적으로 정보를 추출하는 방식을 제안한 이 연구는 Pre-trained Language Model을 활용해 데이터 증강과 재구성을 통해 기존 방식 대비 성능을 크게 향상시켰다. Augmentation 기반의 RoBERTa와 Back Translation을 적용해 데이터 불균형 문제를 해결했으며, Numeric-to-English 변환 등을 통해 모델 학습의 효과를 높였다. 결과적으로, 복잡한 패턴 학습이 가능한 모델링을 통해 전통적인 머신러닝 접근 방식과 비교해 더 나은 성능을 입증했다. 이러한 접근 방식은 실무에서의 데이터 해석과 정보 전달 방식에 있어 큰 변화를 가져올 것으로 기대된다.

Text2Metaphor: 자소서와 면접을 위한 인상적인 표현 생성기
취업 준비의 필수 요소인 자소서와 면접에서 개인의 경쟁력을 높일 수 있는 창의적인 표현을 제공하는 올인원 서비스다. 이 시스템은 자소서 기반 비유 문장 생성, 자소서 소제목 생성, 기업 관련 질문에 대한 답변 생성이라는 3가지 주요 기능을 제공한다. NLP 모델을 활용해 자기소개서 내용에서 키워드를 추출하고, RAG 방법론으로 직무 관련 데이터를 연결해 사용자가 선택한 직무와 연관된 비유적 표현을 생성했다. 발표자는 가상 페르소나를 설정해 직접 시연하며, 직무와 기업 문화에 맞는 문장을 생성하는 과정을 구체적으로 선보였다.

Text Guided ZS-CIR with Segmentation
전통적인 이미지 검색 방식이 전역 정보에만 의존하는 한계를 극복하고, 사용자가 원하는 특정 지역 정보를 더욱 정확히 활용할 수 있도록 CLIP 모델과 Segmentation을 결합한 새로운 접근 방식을 제안했다. 모델은 ImageNet-S와 COCO Segmentation을 활용해 테스트를 진행했으며, 원본 이미지와 유사한 이미지를 효과적으로 탐지하는 모습을 보여줬다. 발표자는 Modality Gap을 줄이기 위한 추가 연구 계획과 함께, 효율적인 인퍼런스 방법론에 대해 논의하며 실질적인 적용 가능성을 강조했다.

One Shot Voice Conversion Attack
짧은 음성 샘플만으로도 목소리를 복제할 수 있는 Voice Conversion 기술의 취약점을 겨냥한 연구다. Style 음성을 기반으로 Noise를 생성해 Voice Conversion모델이 Style 음성 임베딩을 추출하지 못하도록 방해하는 방식으로, 딥 보이스피싱과 같은 스피치 관련 범죄를 방지하는 데 초점을 맞췄다. 기존 연구와의 비교 실험에서는 블랙 박스 모델에서도 Noise가 효과적으로 적용됨을 보여줬으며, 실제 음성과 변환된 음성을 비교해 연구 성과를 입증했다. 해당 기술은 음성 프라이버시 보호 및 AI 스피치 악용 방지에 기여할 것으로 기대된다.

AI 회의 지원 플랫폼 "Clerker"
회의 기록의 비효율성과 정보 누락 문제를 해결하기 위해 개발된 이 플랫폼은 CLOVA Speech API를 활용해 자동으로 텍스트를 생성하고, 이를 요약본과 키워드 형태로 변환한다. 텍스트 청킹을 사용해 긴 텍스트를 의미 있는 단위로 나누고, 최종적으로 MD 포맷으로 보고서를 저장한다. 프롬프트 엔지니어링을 통해 요약본의 정확도를 높였으며, 실제 회의 내용을 기반으로 워드 클라우드와 주요 키워드를 시각화하는 과정을 시연했다. 발표자는 이 플랫폼이 업무 효율성과 협업 능력을 동시에 강화할 수 있다고 강조했다.

AI 패션 플랫폼, 오늘 뭐 입지? 오모입!
이 서비스는 사용자가 이미 소유한 옷을 활용해 날씨와 선호 스타일에 맞춘 코디를 추천하는 맞춤형 AI 플랫폼이다. 공공데이터 API를 활용해 실시간 날씨 정보를 반영하며, 유저의 요청에 따라 지정된 아이템을 코디에 포함시킬 수 있다. 발표자는 이 서비스를 통해 추천받은 코디를 직접 착용하고 발표를 진행하며, 사용자의 편의성을 강조했다.

모든 발표가 끝난 후, 졸업생과 교수진이 축하와 격려의 말을 전했다. 2019년도 D&A 부학회장 곽홍재(빅데이터경영통계‧17)동문은 "기존 모델을 가져다 쓰는 것을 넘어 다양한 시도를 한 점이 인상 깊었다"며 소감을 밝혔다. 또한 2021년도 D&A 학회장이자 X:AI 학회장 마민정(빅데이터경영통계‧19)동문은 "발표 수준이 해를 거듭할수록 개선되고 있어 앞으로가 더욱 기대된다"고 응원의 말을 전했다. 이번 2024 D&X Conference는 학문 간 협력의 새로운 가능성을 보여주는 자리로, AI와 빅데이터가 우리의 일상과 산업에 미치는 영향을 다시 한번 생각할 기회가 됐다.