智能爬蟲能力:支持多線程、分布式智能爬蟲。可定義增量、全量模式,自由選擇爬取頻率,粒度支持分鐘級,支持按周,月遍歷一次全量網站等。
智能分析能力:主要對抓取的分析數據進行內容識別,支持文字、圖片、音視頻、OCR、APP識別與分析。可根據需要靈活配置智能分析引擎。
不良內容庫:基于現有不良內容庫與第三方信息庫,可以不斷識別與更新不良,不良APP,不良信息庫。
架構方便部署:可以靈活地將數據采集與智能爬蟲深度結合,模塊化設計,本地引擎與網絡引擎相結合。
應用靈活擴展:系統采用分布式設計,所有服務程序均可部署在不同主機上,在系統擴容或升級時,可利用新增服務器部署應用服務程序,可以獨立管控或者與其他現有系統聯動管控。
產品概述
上海欣方網絡內容與管控解決方案采用高性能采集設備和機器學習模型,能夠針對海量數據和文件進行業務建模和數據挖掘,采用分布式爬蟲采集數據,完成數據采集功能,實現網絡內容識別、分析、管理與管控。
產品功能
產品特點
產品架構