我們思考,我們紀錄,我們持之以恆地向前走。
非常感謝你加入我們的作者群,以下提供了一些常用的工具與規範,希望能協助你更快上手。
我們目前採用 Docusaurus 作為開發基礎,以下為啟動網頁的基本指令:
git clone https://github.com/DocsaidLab/website.git
cd website
nvm use node
yarn start
請依照下列步驟檢查並設定你的環境,以確保能順利執行:
-
確認 Node.js 版本
- 我們建議使用 Node.js v22 或以上版本。
- 若尚未安裝
nvm
,請先參考 nvm 官方文件 進行安裝。 - 安裝完成後,執行以下指令檢查並設定 Node.js 版本:
nvm install 22 nvm use 22
-
安裝 Yarn
- 如果尚未安裝 Yarn,請透過以下指令進行安裝:
npm install -g yarn
- 如果尚未安裝 Yarn,請透過以下指令進行安裝:
-
安裝相依套件
- 進入專案目錄後,執行以下指令安裝所需的套件:
yarn install
- 進入專案目錄後,執行以下指令安裝所需的套件:
-
檢查網頁啟動埠
- 預設情況下,Docusaurus 會在
http://localhost:3000
執行。 - 若該埠已被佔用,可修改
package.json
中的啟動指令,或透過環境變數設定新的埠號:yarn start --port 3001
- 預設情況下,Docusaurus 會在
-
測試網頁啟動
- 執行啟動指令後,請確定能透過瀏覽器正常訪問網頁。
- 如果遇到問題,可嘗試清除快取並重新啟動:
yarn clear yarn start
-
額外測試
- 若需要測試生產模式,可使用以下指令:
yarn build yarn serve
- 網頁將於
http://localhost:3000
提供測試版本。
- 若需要測試生產模式,可使用以下指令:
Docusaurus 讓我們能直接使用 Markdown 撰寫網頁內容,並透過 React 進行客製化。 詳細功能使用方式,請參考:Docusaurus Markdown Features
在完成專案的開發,並取得一定的成果後,你可能迫不及待地想和所有人分享你的成果。這時候,你可以透過以下步驟,將你的技術文件發佈到我們的網站上:
以下我們以建立 DocAligner
專案的技術文件為例:
-
在
docs
資料夾下,新增一個資料夾,例如docs/docaligner
。 -
在資料夾中新增一個
index.md
檔案,內容為:# DocAligner(專案名稱) 本專案的核心功能稱為「**文件定位(Document Localization)**」。(專案介紹) - [**DocAligner Github(專案的 Github)**](https://github.com/DocsaidLab/DocAligner) --- ![title](./resources/title.jpg)(專案的圖片,可以自己畫或是請 GPT 生成) --- (固定的程式碼,用來顯示專案的卡片) ```mdx-code-block import DocCardList from '@theme/DocCardList'; <DocCardList /> ```
-
在資料夾中新增一個
resources
資料夾,用來存放專案的圖片。 -
其他的技術文件,例如:
docs/docaligner/quickstart.md
: 快速入門指南docs/docaligner/installation.md
: 安裝指南docs/docaligner/advanced.md
: 進階使用方法docs/docaligner/model_arch
:模型架構docs/docaligner/benchmark
:效能評估- ...(其他你想分享的內容)
-
完成後,發 PR 到
main
分支,等待審核。
在開發過程中,你可能會遇到各種大小問題。
你的問題就是其他人的問題,你的解決方案就是其他人的解決方案。
所以,歡迎你將你的問題和解決方案寫成部落格,分享給其他人。
以下是部落格的編寫規範:
-
在
blog
資料夾下,根據日期,找到對應的年份,例如blog/2024
,如果沒有,請新增一個。 -
在年份資料夾下,新增一個資料夾,包含月份日期和標題,例如
12-17-flexible-video-conversion-by-python
。 -
在資料夾中新增一個
index.md
檔案,以剛才的標題為例,內容為:--- slug: flexible-video-conversion-by-python (文章的網址) title: 批次影片轉檔 authors: Zephyr (必須存在於 authors.yml) image: /img/2024/1217.webp (請 GPT 生成,並放在 /static/img 資料夾內) tags: [Media-Processing, Python, ffmpeg] description: 使用 Python 與 ffmpeg 建立指定格式的批次轉換流程。 --- 收到一批 MOV 的影音檔,但是系統不支援讀取,要轉成 MP4 才行。 只好自己動手寫點程式。 <!-- truncate --> (摘要結束標記) ## 設計草稿 (正文開始)
-
在資料夾中新增一個
img
資料夾,用來存放部落格的圖片。為了美觀,使用圖片時,可以在 markdown 文件中使用 html 的語法:
<div align="center"> (圖片置中) <figure style={{"width": "90%"}}> (圖片縮放) ![img description](./img/img_name.jpg) </figure> </div>
-
完成後,發 PR 到
main
分支,等待審核。 -
最後,請確認你的相關資訊有寫入
authors.yml
檔案中,以便我們可以正確顯示你的作者資訊。舉例來說,目前檔案內容如下:
Zephyr: (用來定位作者的名稱) name: Zephyr (網頁顯示的名稱) title: Dosaid maintainer, Full-Stack AI Engineer (作者的職稱) url: https://github.com/zephyr-sh (作者的github) image_url: https://github.com/zephyr-sh.png (作者的頭像) socials: github: "zephyr-sh" (作者的 github 帳號)
更詳細的設定請參考:Docusaurus Blog Authors
讀論文是我們的宿命,寫筆記是為了提醒未來的自己,因為我們的記憶是如此脆弱,連昨天午餐吃了什麼都不記得,更別說讀過的論文。
如果你也想寫筆記,以下是筆記的編寫規範:
-
論文挑選指南:
- 選擇發表在頂會的論文,例如 CVPR、ICCV、NeurIPS 等,以保證論文的品質。
- 若不符合第一項,則選擇引用數高於 100 的論文,表示該論文有一定的參考價值。
- 需要付費才能閱讀的論文不要碰。
- 選擇在 ArXiv 上公開的論文,方便讓讀者取得全文。
-
論文年份:論文年份有幾種,分別是在 ArXiv 上的公開日期、會議的舉辦日期、論文的發表日期等,為了方便查閱,我們選用 ArXiv 上的公開日期。
-
在
papers
資料夾下,根據論文的分支,找到對應的分支,例如papers/multimodality
,如果沒有,請新增一個。 -
在分支資料夾下,新增一個資料夾,包含論文「發表」年月和標題,例如
2408-xgen-mm
。 -
在新建資料夾底下建立
index.md
檔案,文章需要的影像請放在同一層級的img
資料夾中。 -
論文筆記撰寫標準格式如下:
- 標題:格式為年份、月份、論文名稱
- 作者:作者名稱
- 副標題:自己想個有趣應景的副標題
- 論文連結:論文的完整標題與連結
- 定義問題:整理論文作者所定義的問題
- 解決問題:詳細說明作者解決問題的方式
- 討論:解決問題的有效性或爭議性或實驗結果
- 結論:總結論文的重點
-
一個基本範例如下:
--- title: "[24.08] xGen-MM" (論文的標題,業界慣例或作者自己定義) authors: Zephyr (作者名稱,相關定義請寫在 `/blog/authors.json` 檔案內) --- ## 又叫做 BLIP-3 (自己想個有趣的副標題) [**xGen-MM (BLIP-3): A Family of Open Large Multimodal Models**](https://arxiv.org/abs/2408.08872)(論文完整標題與連結) --- 隨便閒聊。 ## 定義問題 整理論文作者所定義的問題。 ## 解決問題 詳細說明作者解決問題的方式。 ## 討論 解決問題的有效性或爭議性或實驗結果。 ## 結論 總結論文的重點。
-
撰寫指南:
- 如果你覺得論文有問題,請優先懷疑是自己沒看懂或是理解錯誤。
- 如果你還是覺得有問題,請先找其他參考資料,不要妄下評論。
- 每篇論文一定有所取捨,請把重點放在該論文的啟發,而非論文的缺點。
- 請保持客觀中立,不要過度批評或過度讚美。
- 如果真的找不到好的部分,請放棄撰寫該篇筆記,你選錯論文了。
- 請保持專業,不要使用不當言語或不當圖片。
-
完成後,發 PR 到
main
分支,等待審核。-
Note
特別注意,新增論文的 commit message 請遵守以下格式:
[A] Add article `Paper Title`
由於我們有撰寫固定的解析文件,用來鎖定論文標題,因此請務必遵守此格式。其他的 commit message 也請不要用到這 Add article 這個關鍵字。
-
我們採用的是基於 React 的 MDX 語法,所以你可以在文章內直接寫 React 程式碼。
以下是一個簡單的範例,先寫一個 HelloWorld.js
組件:
import React from "react";
const HelloWorld = () => {
return <div>Hello, World!</div>;
};
export default HelloWorld;
然後在 markdown 文章內引入,雖然這裡是 md 檔,但實際上都會被解析成 mdx 檔,因此可以直接在其中撰寫 React 程式碼:
import HelloWorld from "./HelloWorld";
# 標題
<HelloWorld />
## 子標題
其他內容
寫完文章後,你愕然發現,我們的網站支援多國語系,可是你不懂其他語言啊!
沒關係,一般來說,有個叫做 Zephyr 的人會幫你做完這件事(?),但你可以自己動手:
-
把你寫的文章放到對應的
i18n
資料夾下,例如:docs
的文章放到i18n/en/docusaurus-plugin-content-docs/current
資料夾下,blog
的文章放到i18n/en/docusaurus-plugin-content-blog/current
資料夾下,papers
的文章放到i18n/en/docusaurus-plugin-content-papers/current
資料夾下。
日文的部分要放到
i18n/ja
資料夾下,其他語言依此類推。 -
然後把放在
i18n
資料夾下的文章內容改成對應的語言,建議可以直接用 GPTs 翻譯,然後移除多餘的語句和肉眼可見的錯誤。 -
最後,發 PR 到
main
分支,等待審核。
我們要提醒的是,儘管現在很多 AI 工具都可以幫助我們生成文章,但一篇真正引人入勝的好文章,必然承載著作者獨特的個人風格和情感表達,而這正是目前 AI 無法完全複製或取代的部分。
AI 模型的核心運作基於統計模型,通過最大似然估計生成內容。這意味著模型更傾向於產生大眾化、常見的語法與句型,從而導致其創作出的內容在風格上往往顯得平淡而類似。正因如此,過度依賴模型的結果,可能使創作者失去原本的個性與靈魂,讓文章缺乏深度與感染力。
如果你發現自己在沒有 AI 幫助的情況下無法創作,甚至頭腦一片空白,這就是個警示:表示你得先鞏固自己的寫作能力,掌握基本的創作技巧。不然,你可能只會淪為模型的傳聲筒。
就我們的經驗來看,AI 模型非常適合用在無聊乏味的重複性工作上,例如表格資料分析、數據彙整等,因為這些任務通常具有高標準化的特點,對準確性和效率的要求極高,但對創造性和靈活度的需求相對較低:
畢竟表格數據不會因為你富有創意而變得更有趣或改變其實驗結果。
以「論文筆記」為例,AI 能協助我們面對艱澀難懂的數學理論,也可以用在「## 討論」這個章節,梳理文獻中的實驗結果和結論。但無法取代我們對論文的理解和思考,也無法替代我們對論文的批判性思考和深入分析;又以「專案文件」為例,對於枯燥的函數輸入和輸出細節,AI 可以幫我們快速產出大量的技術文件,但對於模型設計理念還是得靠自己。至於「部落格」這種完全依賴創作者的風格和思維的文章,AI 的幫助就更少了。
因此,我們應該明確 AI 的使用範圍,並適時地調整自己的創作策略,以確保文章的品質和獨特性。AI 是一種工具,能幫助我們拓展視野、提升效率,而非限制我們的思維或風格。
請記住,在寫作的過程中,真正動人的文字來源於人心。
AI 只會取代不願意思考的人,我思,故我在。
*
2024 © Zephyr