能力中心 > 能力公社 > 海量中文分詞 開發者中心

                          海量中文分詞

                          海量分詞

                          暫無評分 136個項目使用過

                          基本信息

                          • 能力名稱(中文): 海量中文分詞
                          • 能力名稱(英文): HLPretreatProcessor
                          • 版本: v1.18.08.21.1716
                          • 能力入口類名: com.hylanda.processors.pretreat.HLPretreatProcessor
                          • 開發者小靜
                          • 供應商智能中心
                          • 編程語言: JAVA
                          • 授權范圍: 公開
                          • 工程分類: 特征提取
                          • 能力分類: 普通能力
                          • 能力級別: 普通
                          • 能力狀態: 正常
                          • 標簽: 分詞

                          收費方式

                          • 收費方式: 0.001000[按條數](按處理數據量計費)

                          使用說明

                          能力說明

                          功能簡介

                          海量分詞模塊,將一段文本進行分詞處理后,輸出結果

                          配置參數

                          參數名稱 參數類型 是否必填 默認值 參數說明
                          需要分詞的字段 文本 fmt_title,fmt_format_content 指定需要分詞的字段
                          詞顆粒 文本 默認 設置分詞的詞顆粒大小
                          自定義詞典 文本 設置分詞的自定義詞典,詞之間用逗號分隔(全角或半角)

                          輸入簡介

                          輸入數據樣例

                          {"format_content":"你好中國"}
                          

                          輸出簡介

                          新增字段,字段名為"seg+處理字段"。該字段內容為json格式,u為語義指紋,k為關鍵詞,w為普通分詞結果

                          輸出數據樣例

                          {"_seg_format_content":{"u":"d5da05c65abb55b0","w":[["v","你好"],["ns","中國"]],"k":[["中國"],["你好"]]}}
                          

                          相關能力

                          參考指標

                          • 數據質量:100%

                          • 處理性能:微博數據96條/s,資訊數據16條/s

                          4核4G 微博數據96條/s 資訊數據16條/s

                          附加說明

                          隱藏參數說明

                          最新版本

                          • 最新版本: v1.18.08.21.1716
                          • 更新日志: 修改說明文檔

                          用戶評論

                           
                          贵州11选5胆拖计算器