banner
DIYgod

Hi, DIYgod

写代码是热爱,写到世界充满爱!
github
twitter
follow
bilibili
telegram
email
steam
playstation
nintendo switch

女性のパートナーのウェイボーの感情モニタリング

weibo-negative

これで、コードは書けた、あとは彼女がいるだけだ。

最終的な効果は、特定のツイッターユーザーが新しいツイートを投稿した場合、ネガティブな感情と判断された場合に警告を発することです(携帯電話通知、メール通知、自動的に画像付きのツイートを投稿するなど)。

プロジェクトのリンク#

https://github.com/DIYgod/Weibo2RSS ネガティブな感情のツイートを RSS 形式で出力する

https://github.com/DIYgod/Text2Emotion 文章の感情値を分析する

使用方法#

ネガティブな感情のツイート RSS を IFTTT と組み合わせて使用する場合、以下の図のように設定します。条件は RSS に新しいコンテンツが表示されることで、アクションはツイート通知を送信することです(携帯電話通知やメール通知などに変更することもできます)。

negtivewbifttt

 

開発プロセス#

以下は私の開発プロセスです。

一、単語の分割#

これは自分ではできないので、既存の解決策を探しました。以下のいくつかを見つけました:

結巴中文分詞

哈工大言語技術プラットフォーム

新浪クラウド中文分詞

讯飞言語クラウド

テンセント文智

テンセント文智以外はすべて無料またはオープンソースです。簡単に比較した後、私はハンマー Big Bang が使用している讯飞を選びました。

二、感情分析#

これは辞書に重点を置いています。以下のいくつかを見つけました:

中国語感情極性辞書 NTUSD

大連理工感情語彙本体ライブラリ

大連理工の本体ライブラリには 2 万語以上が注釈付けされており、これらの単語の品詞、感情カテゴリ、感情強度、極性などの情報が含まれています。以下のようになります:

dllgemotion

見た目は良さそうですので、これを選びました。

辞書をダウンロードして、まずは csv 形式で保存し、それから mongodb データベースにインポートできます。

mongoimport -d emotion -c emo --type csv --headerline --file emotion.csv

三、感情値の計算#

分析する文章を単語に分割し、各単語の感情値を合計することで、1 つのツイートの感情値を得ることができます。

ここでは、他にも多くのアルゴリズムの作業ができますが、簡単のために、私は単純に合計しました。

しかし、結果が非常に悪いことに気づきました。その理由は、辞書の内容が少なすぎるため、多くの単語が含まれておらず、多くの文を判断することができません。

 

最終的には、上記のすべてのものを廃棄し、有料のテンセント文智のサービスを直接使用しました。。。

四、ツイッターに適用#

ツイートの内容を取得する原理は非常に簡単で、Sina Weibo のツイートショーはログインせずにアクセスできるため、Node.js を使用してページを解析するだけでツイートの内容を取得できます。

そして、ツイートの内容を感情値に変換し、ネガティブな感情のツイートを RSS 形式で出力します。

五、モニタリング#

RSS 形式で出力することで、モニタリングも簡単になります。その中で、IFTTTが最も効果的で、RSS に新しいコンテンツが表示されると、携帯電話通知、メール通知、ツイートなどのアクションをトリガーできます。

 

以上、実際の問題は:私には彼女がいないことです。

読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。