Vision AI 기술 적용을 위한 ultralytics YOLOv11 활용법

딥러닝을 활용한 객체 감지, 세그멘테이션, 분류, 포즈(키포인트) 추출, 오리엔티드 바운딩 박스(방향을 고려한 감지) 등의 연구가 활발히 이루어지고 있습니다. 그 중 YOLOv8과 11은 YOLO(You Only Look Once) 모델을 개발 및 유지보수하는 AI 연구 기업인 Ultralytics가 2023, 2024년에 개발 및 배포한 모델입니다. Ultralytics는 2020년에 PyTorch 기반 YOLOv5를 배포했으며, YOLOv8은 그 후속 버전으로서 높은 사용성을 인정받아 다양한 분야에서 활용되고 있고, 2024년 발표한 YOLOv11은 더욱 개선된 정확도와 효율성을 보여줍니다. 본 포스팅에서는 YOLOv11을 신속하게 사용할 수 있는 방법을 설명합니다.

2 min read

DPF 및 SCR 센서에 대한 정보

배디젤 엔진은 가솔린 엔진에 비해 오염물질이 더 많이 나오며 그 중에서도 특히 질소산화물 (NOx) 과 미세먼지(PM) 가 가장 큰 문제임. 게다가 질소산화물과 미세먼지는 관계로서 미세먼지를 줄이기 위한 완전 연소를 진행하면 질소산화물이 증가하고, 질소산화물을 줄이기 위한 불완전 연소를 진행하면 미세먼지가 증가하는 트레이드 오프 관계를 형성하고 있음. 이를 해결하기 위해 미세먼지를 줄이고, 그로 인해 늘어난 질소산화물을 다시 화학적으로 제거하기 위한 배기가스 저감 장치가 개발되었으며 그 중 가장 대표적인 것으로 선택적 환원촉매 장치(SCR, Selective Catalytic Reduction), 과 디젤 미립자 필터(DPF, Diesel Particulate Filter) 가 있음.

1 min read

서버 메모리 터짐 현상 관련 정보

AI 학습 중 GPU 메모리 과부하가 발생할 수 있으며, 이를 확인하려면 nvidia-smi 명령어를 사용하고, 필요 시 배치 사이즈를 조정해야 합니다. CPU 메모리 과부하는 변수 수나 값 축적이 과도할 때 발생하며, 이를 확인하려면 psutil 라이브러리로 메모리 사용량을 점검할 수 있습니다. 학습 중 과도한 메모리 사용을 피하려면 리스트를 초기화하거나, 예측 결과를 json 형태로 저장하고 불러오는 방법을 사용해야 하며, matplotlib를 사용할 때 이미지 변수는 close 메서드로 메모리 누수를 방지해야 합니다.

1 min read

LLM을 활용한 비정형 데이터 전처리

이 프로젝트는 비정형 데이터를 정형화하고 DB를 구축하는 작업으로, 기존의 룰 기반 전처리 방식에 비해 LLM(대형 언어 모델)을 활용한 전처리가 더 직관적이고 효율적임을 확인한 사례입니다. 화학물질 관련 데이터의 경우, 기존 방식은 예외가 많아 오류가 발생하는 반면, LLM을 이용한 프롬프트 기술을 적용하면 다양한 예외 데이터를 쉽게 처리할 수 있었습니다. 특히, 복잡한 다수의 물질 정보가 포함된 경우에도 LLM을 활용하면 성능이 뛰어나지만, 완벽하지는 않으며 프롬프트 문을 개선할 필요가 있습니다. 이를 통해 공공기관의 데이터 정형화 사업은 LLM을 활용하는 방식이 더 유망하다는 결론을 얻었습니다.

6 min read

구미시 경제활동지표 예측 모델 개발

이 연구에서는 구미시의 경제활동인구 및 취업자 수 예측을 위해 시계열 모델과 LLM을 활용한 두 가지 접근법을 비교했다. 데이터는 경제활동인구, 경제활동참가율, 취업자 수, 고용률 등 총 12개 변수로 구성된 142개 지역의 반기별 데이터를 기반으로 하며, 시계열 모델은 슬라이딩 윈도우 방식으로 데이터를 학습했다. 시계열 모델은 여성 경제활동의 불규칙성을 반영한 변수와 남성/여성 데이터를 모두 사용해 예측 정확도를 높였고, LLM은 산업 특성 및 정책 요인 등을 고려해 예측을 시도했다. 연구는 모델 성능 향상을 위해 도메인 지식과 feature engineering을 활용한 성능 개선을 제시하며, 하이브리드 모델 접근을 통해 예측 정확도 향상이 가능하다고 결론지었다.

4 min read

AI 블로그 작성을 위한 기본적인 깃허브 정보

깃허브에서 제공하는 블로그 기능을 자사 AI 기술 공유용 블로그(이하 AI 블로그)로 확정함에 따라, 기본적인 깃허브 활용법을 공유하고자 작성한 포스팅입니다. 깃 구동 공간, 브랜치. 주요 기능 설명, 규정에 대한 글로 구성되어 있지만, 간단한 설명만 있기 때문에 깃 사용시 발생하는 전문내용은 구글링 혹은 GPT등에 물어 해결해 주세요.

2 min read

감성분석 업그레이드

감성분석을 위한 Naive Bayes 알고리즘과 신경망 기반 언어모델(ELECTRA, GPT)의 성능을 비교한 내용입니다. Naive Bayes는 단어 빈도 기반의 간단하고 빠른 알고리즘이지만 문맥을 고려하지 못하고, 새로운 단어 처리에 제한이 있어 성능에 한계가 있습니다. 반면, ELECTRA와 GPT는 Transformer 구조를 기반으로 문맥을 이해하고, 대규모 데이터로 사전학습되어 뛰어난 성능을 보입니다. 실험 결과, ELECTRA는 Naive Bayes에 비해 8%p 높은 성능을 보였고, GPT는 추가 학습 없이도 비슷한 성능을 보였습니다. 향후 발전 방향으로는 속성기반 감성분석과 적은 데이터로도 높은 성능을 유지할 수 있는 방법을 연구할 필요성이 제시되었습니다.

6 min read

더아이엠씨 AI 블로그 작성법 및 작성 규정정

본 포스팅은 더아이엠씨 AI 블로그 작성을 위해 필요한 정보를 서술하였습니다. 작성 위치, 활용 문법 및 파일 이름 구성, 문체, layout 작성법, 디자인 참조에 대한 내용을 포함하고 있습니다. 참고로 처음 블로그 글을 한다면 author내용을 추가해야하며, layout은 블로그 글 첫줄 부터 반드시 작성하고 나머지 글을 작성해야 합니다.

2 min read

AI 모델 배포를 위한 fastAPI 기본 작성 규정

완성된 사내 AI 모듈을 테스트 용으로 배포할 때 여러 방식(코드 전달 등) 및 여러 프레임워크 등 무질서하게 사용되고 있는 실정에서, 별도 요청이 없다면 파이썬 fastapi 프레임워크를 사용하는 것을 고정하였습니다. 이에 따라, http 프로토콜 메서드, 요청형태, 미들웨어, 도큐멘팅 4가지 요소에서 대한 최소한의 사내 표준을 아래와 같이 설정합니다.

4 min read