1. HOME
  2. ブログ
  3. マッチングアプリで男性の「いいね」獲得に影響を与える要因の統計的分析

BLOG

ブログ

マッチングアプリで男性の「いいね」獲得に影響を与える要因の統計的分析

はじめに

マッチングアプリは、若者の間で一般的な出会いの手段となっています。このブログを読んでいる皆さんの中にも、実際に使ったことがある方や、友人から話を聞いたことがある方がいるのではないでしょうか?私自身も利用経験があります。

マッチングアプリでは、異性からの「いいね」が重要な役割を果たします。お互いに「いいね」を送り合うことで初めてマッチングが成立し、会話が可能となります。そのため、「いいね」の数が多いほど、出会いの可能性が広がるのです。

本記事では、男性ユーザーがマッチングアプリで「いいね」を多く獲得するための要因を、統計的に分析した結果をご紹介します。

手法

使用したアプリ

  • With:大学生から20代後半向けのアプリで、恋活に適したサービス。

絞り込み条件

  • 性別:男性
  • 年齢:23~24歳
  • 登録日:3日以内
  • 居住地:東京都
  • 人数:73名

調査項目

  1. 年収
  1. 身長
  1. 学歴(高卒・大卒など)
  1. 同居形態(一人暮らし・実家暮らし)
  1. タバコの有無(吸う・吸わない・嫌ならやめるなど)
  1. 写真から受ける印象(5段階評価)

データ収集方法

  1. 女性ユーザーとしてアプリに登録。
  1. 上記の絞り込み条件で男性ユーザーを検索。
  1. 各プロフィールから「いいね」数や調査項目に関するデータを収集。

Pythonを用いてデータを分析しました。

また、調査項目⑤の「写真から受ける印象」については、友人と3人でそれぞれ評価を行い、その平均を用いました。評価は顔のみではなく、プロフィール写真全体から受ける印象を総合的に判断しました。たとえば、ロックな雰囲気の写真は好みが分かれそうと評価されたり、トイレで撮影された写真や鼻血が出ている写真は評価を下げる要因となりました。プロフィール写真は最低1枚、多い場合で10枚以上あり、風景や食べ物の写真よりも顔や体が写っている写真を重視して分析しました。

手法の限界点

今回の分析は、あくまで東京都在住の23~24歳男性ユーザーに絞ったものであり、他の地域や年代の結果は異なる可能性があります。しかし、同年代の学生に役立つデータを集めたいという目的があり、この点については満足しています。また、ブログの読者の多くも同年代の男子学生であることを考えると、皆さんにとって興味深い情報になればうれしいです。

また、時間の制約によりサンプルサイズが73名と比較的小規模であるため、データには一定の偏りが含まれているかもしれません。特に、「いいね」数が多い男性のデータが限られているため、その結果が分析全体の精度に影響を与えている可能性があります。この点を考慮しながら、結果をご覧いただければと思います。

結果

「いいね」の分布

Withでは、「いいね」が5個以下の場合、すべて「~5」と表示されます。今回の分析では、この表示を0とみなして集計しました。「いいね」の数は最大103個、平均17.5個、標準偏差24.4個でした。最頻値は「5以下」で、多くの男性の「いいね」数は20以下にとどまっています。一方で、103個もの「いいね」を獲得している男性もおり、その差は大きいと言えます。このような結果を見ると、競争の激しさが感じられますね。

年収の分布

プロフィールで最も多かった「非公開」(36名)は便宜上、収入0として扱いました。「非公開」を除くと、年収600~800万円の層が最も多い、きれいな分布が見られました。

しかし、学歴と「いいね」数との関連は散布図から確認できず、相関は弱いようです。どの年収帯においても、大半の男性の「いいね」数は20未満にとどまり、一部の男性だけが多くの「いいね」を獲得していました。

学歴の分布

大卒(UG)の方が一番多く53名、高卒(HS)が10名、短大・高専・専門卒(JC)が合わせて6名、院卒(Grad)が2名、非公開(Disclosed)・その他(Others)が1名ずつでした。

「いいね」数の平均を見ると、短大・専門・高専卒が29.8と最も高く、大卒の18.6を上回りました。一方、院卒の2名はどちらも「~5」と低い結果でした。このことから、高い学歴が必ずしも「いいね」数の多さに直結しないことがうかがえます。

身長

170cmの人数が最も多く、平均値が172.9 ± 5.6cm、中央値が173cmでした。

身長と「いいね」数の散布図からは、一部の身長が低めの男性が「いいね」を多くもらっていることから、身長が低い方がよりおおく「いいね」をもらっている傾向があるように見えます。ただし、この傾向が強い相関を示しているかどうかはさらなる分析が必要です。

同居人

同居人については、一人暮らし(alone)の男性が33名、実家暮らし(with family)が4名、非公開(disclosed)が32名、その他(Others)が4名でした。一部の実家暮らしの男性が非公開を選んでいる可能性もあるかもしれません。

「いいね」数の平均を見ると、一人暮らしが28.6と圧倒的に高く、実家暮らしが5.8、非公開が8.9、その他が6.5という結果でした。このデータからは、一人暮らしの男性がより「いいね」を獲得しやすいと考えられます。

タバコ

タバコに関する回答では、「吸わない」(グラフ上:「なし」)が最も多く52名を占めました。「吸う」が9名、「嫌ならやめる」が4名、「非喫煙者の前では吸わない」が4名、非公開も4名でした。

「吸わない」と回答した男性の「いいね」数が、他の回答よりも高い傾向が見られました。この結果から、タバコを吸わないことがプロフィールの魅力を高める要因の一つとなっている可能性があります。

写真から受ける印象

写真の印象評価は、3名の評価者による5段階評価の平均値を用いました。全体の平均は2.98、標準偏差は0.859でした。

評価者ごとの特徴も興味深いものでした。評価者A(男性)は辛口、B(男性)は高めの評価をつける傾向がありました。一方で、私自身の評価は基準がややばらついており、標準偏差がAやBよりも大きくなりました。ただし、全体として評価者間に大きな偏りは見られませんでした。評価のばらつきは、自然な主観の違いと考えられます。

平均 標準偏差
私(女性) 2.99 1.040
評価者A(男性) 2.88 0.906
評価者B(男性) 3.07 0.896
3人の各ユーザーに対する平均 2.98 0.859

線形回帰と勾配ブースティングによる「いいね」数の要因分析と予測

「いいね」数の要因を明らかにし、将来的な予測に役立てるために、まず線形回帰を使って要因分析を行いました。その後、線形回帰と勾配ブースティングの精度を比較することで、どちらがより良い予測を提供できるかを検討しました。

線形回帰による要因分析

線形解析①(全項目)

初めに、身長、写真から受ける印象、年収、喫煙の有無、学歴、同居人のタイプの全6項目を用いて重回帰分析(OLS)を実施しました。

結果:

  • R²値: 0.711
  • 二乗平均平方根誤差: 761.9

散布図は予測精度、また表はそれぞれの変数の統計値です。

x1 ~ x17まで順に、身長・写真から受ける印象・年収・タバコ(非公開・非喫煙者の前では吸わない・嫌ならやめる・吸わない・吸う)・学歴(非公開・大卒・高卒・短大卒・その他・大卒)・同居人(一人暮らし・非公開・その他・実家暮らし)。

線形解析②(5項目)

次に、学歴を除外し、タバコと同居人をそれぞれ「吸うかどうか」「一人暮らしかどうか」の二値分類に変更しました。この変更後の結果は以下の通りです。

  • 結果:
    • R²値: 0.456
    • 二乗平均平方根誤差: 403

予測の精度はやや下がったものの、負の値を含む予測が減少した点で改善が見られました。

x1 ~ x7までそれぞれ:身長・写真から受ける印象・年収・タバコ(その他・吸う)・同居人(その他・一人暮らし)。

主な発見

  • 身長: 低い方が「いいね」数が増加する傾向。身長が低い人の一部が「いいね」を多くもらっていたことが分析結果に影響を与えていると考えらる。
  • 写真から受ける印象: 最もP値が低く(0.082)、「いいね」に与える影響が大きい。
  • 年収: 線形回帰ではP値が高く、「いいね」に影響が少ないと判断。
  • タバコと同居人: どちらも標準誤差が大きく、影響の信頼性が低い。

勾配ブースティングによる予測

線形回帰②と同じデータを用いて、勾配ブースティングでも予測を試みました。線形回帰ではテストデータより低い予測値が多かったのに対し、勾配ブースティングではその偏りが解消しました。

また、重要度分析で各変数の重要度を比較したところ、以下の順に影響が大きいと判明しました。

  • 写真から受ける印象
  • 年収
  • 身長
  • 同居人のタイプ(実家暮らしであること)
  • タバコの有無(その他を選んでいること)

まとめ

分析をするにあたり、もとにしたデータのばらつきが大きかったためか、これという明確な結果は出ませんでした。

しかし、どの分析でもどうやら「写真から受ける印象」が重要そうだということが分かりました。学歴については、必ずしも高い方が「いいね」をもらえるわけではないようです。年収については、散布図から考えると関係がないように見え、線形回帰ではその通りの結果でしたが勾配ブースティングでは比較的高い重要度になりました。タバコは吸わない人の方が「いいね」が高い傾向があり、勾配ブースティングの重要度からも同じような結果となりました。同居人については、一人暮らしの方が「いいね」数が高そうな傾向がありましたが、線形回帰と勾配ブースティングからはよく分かりませんでした。

この結果から一点、マッチングアプリをこれから始める方にアドバイスをするなら、まずはよい印象が与えられるように写真をよく選ぶことでしょうか。整えると言ってもそこまで難しいことはなく、まずは清潔感のある写真であること(例えばトイレの中で自撮りをしない、髪がぼさぼさのまま撮影しないなど)、顔がしっかり見えること、そして何より笑顔で楽しそうであることが重要なのだと思います。

また、タバコを吸わないことや一人暮らしであることも「いいね」数にプラスに働く可能性があります。ただし、それ以外の属性についてはあまり気にせず、自分らしさを大切にしたプロフィール作りが重要かもしれません。

統計解析に改善の余地があるものの、非常に興味深いデータを得られた分析でやりがいがありました。分析に協力してくれた友人AとBに感謝します。

2024年12月5日
工学系研究科 鈴木美智

スーパーデータサイエンスアワード2024年度春学期

 

ブログ