전체 보기
🍀

ML 모델 data set 수집

작성일자
2023/03/18
태그
DIARY_DEVELOP
프로젝트
BeachCombine
책 종류
1 more property

공부한 내용

data set 사이트

[국내]
AI 팩토리
공공데이터포털
AI허브
데이콘
보건의료빅데이터개방시스템
영화관입장권통합전산망
[국외]
캐글
구글 dataset search
레딧
UCI
tenserflow dataset

수집한 data set

쓰레기가 있는 해변과 쓰레기가 없는 해변 이미지를 서칭했다.
플라스틱 쓰레기 있는 모래사장 & 깨끗한 모래사장
사이즈 : 76장 * 2클래스
라벨링 : O
생각보다 거의 없다,,,, #ocean #beach+ #trash #garbage 요 정도로 검색해봤는데,,, 좀 더 다양하게 검색해보긴 해야겠지만 일단 쓸만한 건 위에 데이터셋 뿐이다. 정말 다행히도 위에 데이터셋이 딱 우리 프로젝트 요구사항을 만족한다,,,, 딱 하나 아쉬운 점은 플라스틱 쓰레기라는 건데, 사진을 보니 플라스틱이 병만 포함한 게 아니고 범주가 좀 넓은 플라스틱 쓰레기들이라 괜찮을 거 같다.
추가로 쓰레기통 데이터셋도 추후에 쓰일 수 있어 줍줍했다.

하루 정리

TIL 작성하기
싸강 듣기!!!!!!!!!!!!! 3주차
BeachCombine
머신러닝 모델 data set 찾아다니기
AI
토종 백엔드의 AI 도전기,,,, 백엔드로 참여한 프로젝트에서 AI 사용이 필요한데 AI 인원이 없어,,, 직접 도전하기로 했다 ^^ 하고 싶은 직무는 백엔드지만 AI쪽은 약간 교양 느낌으로,, 알아 두면 어쨌든 좋을 거 같아 학교 수업으로 기계학습기초를 수강했었고, 이번 학기엔 기계학습심화를 수강 중이다. 학교에서 배운 내용이 어느 정도 도움이 되는 거 같아 기쁘다.
작년에 눈물을 머금고 tensorflow object detection과 cnn을 이용해 수화 이미지 분류기를 만들었던 기억이 있는데,,, 이번 건 좀 더 수월하길 바란다,,, 일단 시작은 리프레쉬하는 거 같아 나쁘지 않다.
작년에 만든 수화 이미지 분류기,,,,
Backend
문득, OOPY를 이용해서 노션 페이지를 웹 사이트로 만든 걸 직접 해보는 것도 재밌겠단 생각이 들었다. 물론 서버 비용은 오히려 OOPY를 쓰는 게 더 저렴할 지도 모르지만, 또 굉장히 편리하지만, 아주 가끔 동기화 부분에서 불편함을 느낄 때가 있어서 내가 직접 만들어 써볼까란 생각이 들었다. 물론, 지금 떠올린 방법으론 중간에 막히는 부분이 많을 수 있지만 한 번 도전해봐야겠다.
불편해서 개선하고 싶은 점
가끔 503이 뜸
→ 사실 내가 해도 똑같을 확률 높음 ㅎ
하단 페이지 동기화가 안되어서 직접 하나하나 해줘야 할 때 많음
→ 이 역시 내가 해도 똑같을 확률 높음,,
데이터베이스를 캘린더 보기를 했을 때 포스트들이 밀려서 엉뚱한 날짜에 뜸
→ 이게 젤 불편했다,,, 정 안되면 이 부분만이라도 내가 따로 API만 구현해서 기존 OOPY 사이트에 붙여 넣을까 고민이다.
추가하고 싶은 기능
하나 있는데, 비밀이다,, 내 소즁한 아이디어니까,,,
→ 이건 이전부터 만들고 싶었는데, 이것도 따로 API만 구현해서 기존 OOPY 사이트에 붙여 넣는 것도 좋을 거 같다.