목록AIH 학부연구생 (15)
archive
연구 끝 !뿌듯하구만아 그리고 이번 기회에 깃허브 아무것도 안 하고 잠만 자고 있던 계정을 흔들어 깨워서 사람답게 꾸며주고 업데이트 시켰음 ! 학부연구생 관련 자료 다 올려두었다 https://github.com/Ahn-Jeongmin Ahn-Jeongmin - OverviewChung-ang University Seoul Campus Expected Grad: Feb, 2025 - Ahn-Jeongmingithub.com 최적화 : 손실함수에서 손실이 가장 적은 부분을 찾아가는 것, 그리고 그 알고리즘. 즉 학습속도를 빠르고 안정적이게 하는 것을 목표로 한다Adam:RMSProp(모든 자료보다는 일부분의 자료에 대해 이전 맥락을 고려해 모르는 곳은 보폭을 크게, 잘 아는 곳은 보폭을 작게, 보폭 결..
내가 진짜 초짜라 모델 저장도 못 하고 코랩 런타임 끊기면 다 날아가는 거에서 아등바등 중이라 그런 거일 수도 있는데, 하여간 데이터 전처리 여간 이거저거 신경 써야되는 게 아니더만요... 하여간 글자 수 모델에 맞게 좀 줄이고, 그리고 mbti도 문자열로는 라벨로 전달이 안 되는 터라 다 정수화해서 인코딩하는 작업까지 추가함 mbti_types = [ "ISTJ", "ISFJ", "INFJ", "INTJ", "ISTP", "ISFP", "INFP", "INTP", "ESTP", "ESFP", "ENFP", "ENTP", "ESTJ", "ESFJ", "ENFJ", "ENTJ" ] import pandas as pd # CSV 파일 불러오기 df = pd.read_csv("C:\\Users\\jordi\\..
데이터 전처리 프로세스는 캐글을 참고해서 처리하긴 했다 사실 처리 부분에서 참고한 부분은, 데이터 분석 부분인데, 사실 데이터를 보고 아 키 값이 아니라 밸류 값 부분을 조금 깔끔하게 정제하고, url 같은 것들은 좀 걸러내고, 길이도 줄여야겠다 싶은 부분들은 있었으나, 키값에 대한 부분을 전혀 고려하고 있지 않았는데, 다음과 같이 확인해 보니 데이터가 주어진 비율적인 부분들이 달랐다는 것도 알게 되어 생각보다 노이즈가 많은 데이터를 사용 중이었구나 느낌. 그리고 확실히 데이터를 사용하기 전에는 이것저것 분석하고 비율을 따져보며 신중하게 접근해야한다는 것을 느꼈다. (+)아 그리고 뭔가 모델 파인튜닝을 바로 저 큰 데이터로 돌리기 무서워서 트레인 데이터 셋을 셋으로 나눠서 집어넣기로 함 그래서 다음이 위..

아주 기세등등하게 파이토치로 "제가 직접 인공신경망 구성할 겁니다 !" 하고 연구미팅에서 큰소리 땅땅 쳤더니 이기성 교수님한테 아주 그냥 바로 빠꾸 당함 사실 자신도 없었고 시간 안에 할 수 있을까라는 생각이 들기는 했었다만 생각보다 훨씬 복잡하고 훨씬 고려해야하는 사항이 많은 것이 바로 딥러닝의 세계였다 그래서 해 주신 말씀이... 다들 딥러닝 건드리기보다는 그래서 머신 러닝으로 학부생은 시작해보는 거라고... 근데 또 이제 인공지능 공부 이제 막 시작한 애가 저 딥러닝 할 거에요 ! 했을 때 교수님은 얼마나 웃겼을까 싶기도 하고... ㅎㅋ 역시 아무것도 모르는 사람이 덤볐을 때 제일 우스운 거라고 ㅋㅋ....... 이제 진짜 길을 잡았으니, 정말 제대로 해서 이 부끄러움 만회하는 수밖에 없다. 서론이..
1. 각 mbti INFP ENFP INFJ ENFJ INTP ENTP INTJ ENTJ ISFP ESFP ISFJ ESFJ ISTP ESTP ISTJ ESTJ 기승전결을 분류해서 텍스트 요약 -> 각각의 상황에서 어떻게 해결을 할 것인지 내가 소설 속 주인공이려면? 이거 너무... 연구 전문성이 없는 거 같 CLOVA Chatbot - AI Services - NAVER Cloud Platform 네이버 클라우드 플랫폼 (ncloud.com) 네이버 클라우드에서 제공하는 챗봇 서비스 사용해도 좋을 거 같은데... Gradio ChatInterface 문서 네이버는 다 네이버가 해 주는 대신 얜 직접 호출해서 내가 코드로 다 구현할 수 있는 거 같다 mbti 별 내가 이 소설 속 등장인물이 된다면 소설의..

텍스트 수집: 원본 어른용 문학의 텍스트 데이터를 수집 -> 공개 도서, 전자책 텍스트 정제 및 전처리: 불필요한 구두점 제거, 대문자를 소문자로 변환, 특수 문자 제거 등이 포함됩니다. // chat gpt를 통한 어린이용 소설 창작 playground -> 파라미터 직접 설정 가능 // 내가 기여할 수 있는 부분-> https://blog.naver.com/pjt3591oo/221913081091 문서 유사도 검사, 중요 부분 누락되지 않았는지 검사 추상요약 , 장르 한정 (고전...................// 신화, 기사도문학, 고전) - 단테의 신곡 케이스 스터디 먼저 해 보고 -> 유사한 애 마음에드는 작품으로 하나 골라서 해 보고 일반화 자동화시키기 어느 수준까지 자동화를 시킬 수 있을 ..