海量分詞
暫無評分 136個項目使用過海量分詞模塊,將一段文本進行分詞處理后,輸出結果
參數名稱 | 參數類型 | 是否必填 | 默認值 | 參數說明 |
---|---|---|---|---|
需要分詞的字段 | 文本 | 是 | fmt_title,fmt_format_content | 指定需要分詞的字段 |
詞顆粒 | 文本 | 否 | 默認 | 設置分詞的詞顆粒大小 |
自定義詞典 | 文本 | 否 | 無 | 設置分詞的自定義詞典,詞之間用逗號分隔(全角或半角) |
無
{"format_content":"你好中國"}
新增字段,字段名為"seg+處理字段"。該字段內容為json格式,u為語義指紋,k為關鍵詞,w為普通分詞結果
{"_seg_format_content":{"u":"d5da05c65abb55b0","w":[["v","你好"],["ns","中國"]],"k":[["中國"],["你好"]]}}
無
數據質量:100%
處理性能:微博數據96條/s,資訊數據16條/s
4核4G 微博數據96條/s 資訊數據16條/s
無
無
添加評論