본문 바로가기
AI-LAB/회의록

[회의록] 2023.06.26

by JS LAB 2023. 6. 26.
728x90
반응형

주제 : (의료?) 데이터를 이용해 챗봇 개발

 

데이터셋 사이트

1. 보건의료빅데이터개방시스템

의료데이터라 관련서류 제출필요

https://opendata.hira.or.kr/home.do

 

보건의료빅데이터개방시스템

건강보험심사평가원에서 보유하고 있는 다양한 보건의료데이터를 국민에게 개방합니다. 서비스 소개 바로가기 이전 일시정지 시작 다음

opendata.hira.or.kr

 

2. Aihub 소아관련 음성+텍스트

https://www.aihub.or.kr/aihubdata/data/list.do?pageIndex=1&currMenu=115&topMenu=100&dataSetSn=&srchOrder=&SrchdataClCode=DATACL001&searchKeyword=%EC%86%8C%EC%95%84&srchDataTy=DATA003 

 

AI-Hub

 

www.aihub.or.kr

 

3. AIhub 의료분야 음성데이터

의료데이터라 관련서류 제출필요

https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=566 

 

AI-Hub

분야헬스케어 유형 오디오 , 텍스트 구분 안심존(오프라인) 갱신년월 : 2023-05 구축년도 : 2021 조회수 : 4,174 다운로드 : 20 용량 : 관심데이터 등록 관심 14

www.aihub.or.kr

 

4. Aihub 정신건강진단 및 예측을 위한 멀티모달 데이터

https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=573

 

 

해결해야할 점 + 문제점

대부분 음성데이터와 결합된 형태라 용량이 매우크다

 

소아과 관련 데이터는 찾고 싶은데 제출절차가 있고 

데이터 얻기가 쉽지 않다

 

회의내용

1. 의료데이터는 수집하기 어렵고, 데이터도 많이 부족했다.

정신질환 관련 데이터는 교수님 지인 분께서 비추하셨다.

 

2. 반려동물 관련 Q&A 데이터 (네이버지식인 등) 조사해보기로 하였다.

 

3. 법률 지식 데이터도 조사하기로 하였다.

법률지식은 판례가 많기에 자료는 쉽게 구할 수 있겠지만
특정분야를 더 집중적으로 해볼 수 있다면 좋다고 하심. 

 

4. 따라서 다음 미팅까지 해야할 일은

의료데이터(사실상 거의없음 현재는),

반려동물 Q&A 데이터 (수의사 답변글이면 더좋음),
법률 지식 데이터 셋 등을 조사하는 것,

그리고 이미지나, 음성은 배제하고 조사하기로한다.

 

5.또한 의료 데이터 크롤링 권한 여부도 같이 알아본다.

 

6. 챗봇개발까지 목표점을 둔다

 

 

 

 

 

 

728x90
반응형