小牛翻譯開源社區

NiuTrans統計機器翻譯系統

簡介
NiuTrans是一個開源的統計機器翻譯系統,由中國的 東北大學 自然語言處理實驗室 開發。NiuTrans系統全部由C++開發,運行速度快,占用内存少。目前該系統支持基于(層次)短語/基于句法的模型,可供研究之用。


系統特色
1. 由
C++編寫,運行速度快。
2. 支持
多線程
3. 簡單易用的
API
4. 翻譯任務中高質量的翻譯效果
5. 内嵌小巧、高效的
N-元語言模型,無需其它軟件(如SRILM)的外部支持。
6. 支持多個統計機器翻譯模型
   a)
基于短語的模型
   b)
基于層次短語的模型
   c)
基于句法(樹到串,串到樹,樹到樹)的模型


下載
本系統為開放源碼系統,依照GNU公用許可證(GPL)發布。
請點擊 下載地址 
下載本系統的源代碼和樣本數據。


系統運行要求
Windows用戶:要求Visual Studio 2008,Cygwin,以及 perl(5.10.0 版本或更高)。建議默認在“C:\”路徑下安裝cygwin。

Linux用戶:要求gcc(4.1.2版本或更高),g++(4.1.2版本或更高),GNU Make(3.81版本或更高)以及perl(5.8.8 版本或更高)。

注意:運行本系統的最低要求為2GB内存10GB 硬盤空間。 如果使用大規模的語料訓練本系統,則需要更多的内存和硬盤空間。建議使用64位操作系統以支持大規模語料/模型(如N-元語言模型) 。


安裝
請解壓下載的軟件包(假設安裝目錄是“NiuTrans”),按照如下說明安裝本系統。

對于Windows用戶,
   - 在“NiuTrans\src\”下打開“NiuTrans.sln”
   - 設置編譯模式為“Release”
   - 設置平台模式為“Win32”(32位OS)或“x64”(64位OS)
   - 構建整體解決方案
 在“NiuTrans\bin\”目錄下生成了所有的二進制文件。

對于Linux用戶,
   $ cd NiuTrans/src/
   $ chmod a+x install.sh
   $ ./install.sh -m32 (32位OS) 或 ./install.sh (64位OS)
   $ source ~/.bashrc
 在“NiuTrans/bin/”目錄下生成了所有的二進制文件。


手冊
NiuTrans中提供描述更多關于NiuTrans細節的手冊,同時介紹如何使用NiuTrans更好搭建統計機器翻譯系統。點擊這裡下載pdf版手冊。


NiuTrans團隊
朱靖波(項目負責人)
肖桐(技術負責人)
李強
杜權
王強

緻謝:在本項目實施的過程中,獲得了往屆畢業生的支持,他們是:張浩(解碼器,調序模型),陳如山(語言模型),姚樹傑(數據選取和數據預處理),馬骥(語言模型,CWMT2013基線系統),孫坤傑(CWMT2013漢英基線系統),劉卓(CWMT2013英漢基線系統)。


如何引用NiuTrans
如果您在研究中使用了NiuTrans,請在參考文獻中注明引用如下論文
Tong Xiao, Jingbo Zhu, Hao Zhang and Qiang Li. 2012. NiuTrans: An Open Source Toolkit for Phrase-based and Syntax-based Machine Translation. In Proc. of ACL, demonstration session.


獲得幫助
有關NiuTrans, 請發送e-mail至niutrans@mail.neu.edu.cn。我們将為您詳細解答。


NiuTrans曆史
NiuTrans 1.3.1 Beta版 - 2014年12月1日(解碼器及句法規則抽取bug修複)
NiuTrans 1.3.0 Beta版 - 2013年7月17日(bug修複,解碼器升級,數據預處理系統升級,增加CWMT2013評測專用腳本
NiuTrans 1.2.0 Beta版 - 2013年1月31日(bug修複,解碼器升級,增加數據預處理系統,增加詞對齊工具,增加recasing模塊)
NiuTrans 1.1.0 Beta版 - 2012年8月1日(bug修複)
NiuTrans 1.0.0 Beta版 - 2012年7月7日(支持三套基于句法的模型)
NiuTrans 0.3.0版 - 2012年4月27日(支持基于層次短語的模型)
NiuTrans 0.2.0版 - 2011年10月29日(bug修複,支持32位操作系統)
NiuTrans 0.1.0版 - 2011年7月5日(第一個版本)


緻謝
本項目的部分工作獲得了如下支持:國家自然科學基金(60873091; 61073140), 高等院校博士學科點專項科研基金(20100042110031), 以及中央高校基本科研基金。



至2014年4月16日下載1700次。本頁最後修改于2014年4月16日。

本網站由馮子怡、年賀設計。