これで、コードは書けた、あとは彼女がいるだけだ。
最終的な効果は、特定のツイッターユーザーが新しいツイートを投稿した場合、ネガティブな感情と判断された場合に警告を発することです(携帯電話通知、メール通知、自動的に画像付きのツイートを投稿するなど)。
プロジェクトのリンク#
https://github.com/DIYgod/Weibo2RSS ネガティブな感情のツイートを RSS 形式で出力する
https://github.com/DIYgod/Text2Emotion 文章の感情値を分析する
使用方法#
ネガティブな感情のツイート RSS を IFTTT と組み合わせて使用する場合、以下の図のように設定します。条件は RSS に新しいコンテンツが表示されることで、アクションはツイート通知を送信することです(携帯電話通知やメール通知などに変更することもできます)。
開発プロセス#
以下は私の開発プロセスです。
一、単語の分割#
これは自分ではできないので、既存の解決策を探しました。以下のいくつかを見つけました:
テンセント文智以外はすべて無料またはオープンソースです。簡単に比較した後、私はハンマー Big Bang が使用している讯飞を選びました。
二、感情分析#
これは辞書に重点を置いています。以下のいくつかを見つけました:
大連理工の本体ライブラリには 2 万語以上が注釈付けされており、これらの単語の品詞、感情カテゴリ、感情強度、極性などの情報が含まれています。以下のようになります:
見た目は良さそうですので、これを選びました。
辞書をダウンロードして、まずは csv 形式で保存し、それから mongodb データベースにインポートできます。
mongoimport -d emotion -c emo --type csv --headerline --file emotion.csv
三、感情値の計算#
分析する文章を単語に分割し、各単語の感情値を合計することで、1 つのツイートの感情値を得ることができます。
ここでは、他にも多くのアルゴリズムの作業ができますが、簡単のために、私は単純に合計しました。
しかし、結果が非常に悪いことに気づきました。その理由は、辞書の内容が少なすぎるため、多くの単語が含まれておらず、多くの文を判断することができません。
最終的には、上記のすべてのものを廃棄し、有料のテンセント文智のサービスを直接使用しました。。。
四、ツイッターに適用#
ツイートの内容を取得する原理は非常に簡単で、Sina Weibo のツイートショーはログインせずにアクセスできるため、Node.js を使用してページを解析するだけでツイートの内容を取得できます。
そして、ツイートの内容を感情値に変換し、ネガティブな感情のツイートを RSS 形式で出力します。
五、モニタリング#
RSS 形式で出力することで、モニタリングも簡単になります。その中で、IFTTTが最も効果的で、RSS に新しいコンテンツが表示されると、携帯電話通知、メール通知、ツイートなどのアクションをトリガーできます。
以上、実際の問題は:私には彼女がいないことです。