-
Notifications
You must be signed in to change notification settings - Fork 40
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[20230416] Weekly AI ArXiv 만담 시즌2 - 14회차 #80
Comments
이번 주에도 중요한 연구가 많이 발표되었지만 뉴스에 집중하도록 하고 다음 주에 정리하도록 하겠습니다. PR12 발표: 지난 주 리뷰: 뉴스 겸 연구: ChatGPT의 라이선스에서 GPT 모델의 출력을 경쟁 언어모델을 만들기 위해 사용하는 것을 금지하는 조항이 있는데 최근 DataBricks에서 최초의 완전히 오픈소스 모델인 Dolly2를 공개했습니다. In-house LLM을 만드는데 많은 도움이 될 것으로 생각됩니다. Building LLM applications for production MLOps 관련 책의 저자이자 블로거로 유명하신 Chip Huyen님께서 LLM을 production에서 사용하기 위한 블로그를 업로드했습니다. 제품을 만드는 엔지니어들에게 많은 도움이 될 것이라고 생각합니다. Choose Your Weapon: Survival Strategies for Depressed AI Academics 거대 기업의 거대한 리소스에 압도당한 연구원들을 위한 전략을 제시하는 블로그성 논문이 업로드되었습니다. 연구주제를 찾아가는데 도움이 될 것으로 생각됩니다. Stanford AI Index Report 2023 Chapters 7 & 8 인공지능 연구원의 성별, 인종 등 구성 (Chapter 7) 및 인공지능에 대한 여론 (Chapter 8)에 관련된 내용입니다. 요약: 학부 및 고등학교 과정에서 성별 불균형이 감소하고 있으나 대학원 이상의 과정에서는 현재 큰 변화 없음. 요약: 대중적으로 동양에서 인공지능에 대해 가장 긍정적인 인식을 가지고 있으며 반대로 비국 등 서양권에서 부정적인 인식이 강함. 특히 자율주행 차량은 안전하지 않다는 인식이 강함. 인공지능에 의해 대체되는 것에 대한 염려가 부정적 인식의 가장 큰 원인으로 꼽힘. |
AGI
Dolly - LoRa - GPT-J-6b
Auto-GPT: An Autonomous GPT-4 Experiment🔴 🔴 🔴 Urgent: USE
|
Open Assistant
LAION AI가 Pythia와 LLaMA 기반으로 10B+ 모델들을 제작하고 공개했습니다. 특히 두 모델을 만드는 모든 과정에 사용된 재료들을 공개한 것 같습니다. 리포트에 따르면 Pythia-12B만 해도 93.5% preferable as GPT-3.5.turbo라는데, 사용해보면서 확인할 예정입니다. LLaMA 모델은 곧 공개하겠다고 하는데, 아직 올라오지는 않은 것 같네요. 주요 훈련 기법
특히 Reward Model인 Deberta checkpoint도 공개한 덕분에 이쪽 분야 공부하는데에 도움이 될 것 같네요. 데이터셋161,443개의 메세지와 461,292개의 메세지 퀄리티 평점으로 구성되어 있습니다. 주요 언어는 영어와 스페인어(영어 40%, 스페인어 30%)이며, 현재 어플리케이션에서 한국어로 인사를 해도 영어로 답변이 나옵니다. Conversation Tree라는 자료구조로 데이터셋을 구성했는데, prompt-assistant가 대화를 주고받는 방식으로 구성이 되어 있습니다. 이때 각 Node는 반드시 인간일 필요는 없으며, 기계의 데이터도 어느 정도 들어간 것으로 보입니다. Root Node - Leaf Node로 향하는 각 path를 thread로 정의했습니다. 161,443개의 메세지는 약 92,000개의 prompt message와 약 69,600개의 assistant reply로 구성되어 있습니다 |
Stanford AI Index Report - Chapter 5고등교육에서의 AI EducationGraduates# of FaclutyWho Funds CS Departments in the U.S.?K–12 AI EducationUSInternationalChapter HighlightsMore and more AI specialization
New AI PhDs increasingly head to industry
New North American CS, CE, and information faculty hires stayed flat
The gap in external research funding for private versus public American CS departments continues to widen( 570만 달러 vs 970만)Interest in K–12 AI and computer science education grows in both the United States and the rest of the world
|
Stanford AI Index Report - Chapter 3unsurprising results, yet still surprising when we look at the numbers. 3.1 Meta-analysis of Fairness and Bias Metrics3.2 AI Incidents (feat. AIAAIC)
3.3 NLP Bias Metrics
Appendix
3.4 Conversational AI Ethical Issues - ChatGPT
3.5 Fairness and Bias in Text-to-Image Models
3.6 AI Ethics in China(직접 읽어보시는게 좋을 듯 합니다!) 3.7 AI Ethics Trends at FAccT and NeurIPS
3.8 Factuality and Truthfulness |
Stanford AI Index Report - Chapter 4Highlight 1. 22년은 지난 10년 간 처음으로 AI에 대한 투자가 감소한 해
Highlight 2. AI 업계에서 가장 많은 투자를 받은 분야는 (1)의료 및 헬스케어(61억 달러), (2)데이터 관리, 처리, 클라우드, 인프라(59억 달러), (3)핀테크(55억 달러)Highlight 3. AI의 비즈니스 적용 사례 비율은 (1)RPA(39%), (2)Computer Vision(34%), (3)NLP(33%), (4)Virtual Agent(33%)
4.1 Jobs
4.2 Investment4.3 Corporate Activity4.4 Robot Installation |
News
2023 Stanford AI Index Report 특집
10개 Key message
Ch2. Tech Performance - Timeline in 2022
Ch6. Policy and Governance
전체 하이라이트
![image](https://user-images.githubusercontent.com/11782739/232225623-bdb10de6-b5b9-4b96-a53d-6382f9b4d59c.png)
법안 관련
정부에서 AI에 대한 언급
국가 AI 전략 현황
![image](https://user-images.githubusercontent.com/11782739/232227808-5a8ee7ff-0f2a-4913-8df9-b962c502af1a.png)
미국 AI 예산 투자
미국 AI관련 소송판례
The text was updated successfully, but these errors were encountered: