GOPHERSPACE.DE - P H O X Y
gophering on hngopher.com
HN Gopher Feed (2017-10-28) - page 1 of 10
 
___________________________________________________________________
Uncaptcha: Defeating Google's audio reCaptcha with 85% accuracy
54 points by nreece
https://github.com/ecthros/uncaptcha
___________________________________________________________________
 
barbolo - 2 hours ago
Nice work. It also publishes a file mfcc.py which uses Mel
spectrogram to solve the audio offline. With enough data, a model
based on MFCC should work much better than any cloud service
(general speech recognizer).
 
  barbolo - 2 hours ago
  Another interesting fact is that TensorFlow 1.4 supports native
  MFCC spectrogram tensors.
 
hedora - 2 hours ago
I?d love for this to be a browser plugin.  I don?t stay logged into
google or let them set cookies, and some days I think that instead
of doing machine learning in house, they just farm it out to people
like me by holdings random sites hostage.
 
  jdavis703 - 48 minutes ago
  Actually you're helping to classify their datasets for ML
  purposes, so in a sense you're tilling their farm for them (while
  also helping ensure the site you're on has less spam than it
  would otherwise).
 
bdcravens - 4 hours ago
> From there, each number audio bit is uploaded to 6 different
free, online audio transcription services (IBM, Google Cloud,
Google Speech Recognition, Sphinx, Wit-AI, Bing Speech
Recognition)Gotta love that they're using Google's cloud resources
to defeat Google's reCaptcha
 
stevenwoo - 2 hours ago
There are some confounding factors (from my reading) - a.) the more
likely Google thinks you are a human, the easier the tests/less
tests you have to pass - are they repeating the test on the same
computer all the time or are they mixing it up some how b.) the
README states Google uses some of your interaction speed
times/history with internet/Google to determine level of difficulty
of captcha - if it's the same computer - and they repeat the tests
on the same computer, are they just getting easier tests the better
it gets?  (My experience with visual captchas is I would be happy
to get 85% success rate with those).  They probably are not seeding
the computer with 9 days of simulated activity to get the easiest
captcha suite to make it seem human or are they? c.) since there
could be multiple tests if Google thinks you are a computer, are
they counting successful attempts in an ultimately unsuccessfuly
run - is passing 5 then failing the 6th count as 5 success /1
failure or 1 failure?
 
  [deleted]