gophering on
HN Gopher Feed (2017-07-27) - page 1 of 10
Sci-Hub's cache of pirated papers is so big, subscription journals
are doomed
324 points by happy-go-lucky
koolba - 4 hours ago
So is Sci-Hub like Oink[1] for scientific papers?EDIT: For those
not familiar, Oink was a torrenting site but what distinguished it
from the tons of other sites was how highly curated it was. High
quality audio, proper grouping and genres, and best of all you
could request anything that was missing and the community would
magically add it.[1]:
  philipkglass - 3 hours ago
  A lot of papers get ingested into sci-hub while they're still in
  the preprint/early-access stage. Sci-hub doesn't appear to
  reingest papers after the final version is published. It's one of
  my very few gripes about the system. A more quality-focused
  system would probably handle this edge case.
    poppingtonic - 3 hours ago
    This seems more like a versioning issue. Can't papers that pass
    review get a new DOI? I'm thinking something like semver for
    scientific papers or scientific data, more generally. DOIs even
    look like semver versions, so why not add more space for the
    different review papers?
      philipkglass - 2 hours ago
      I'm talking about papers like this:http://sci-'s already passed peer
      review, but the final version will be tidied up with
      additional editing and will have e.g. the line-by-line
      numbering stripped out. I see sci-hub versions of papers from
      months ago, or older, that never update to the final edition.
      The content doesn't differ much but the final version may
      have better-placed figures, corrected typos, and other minor
        aw3c2 - 1 hours ago
        If different versions of a paper have different DOI then
        the DOI is broken and should be replaced by something
        better.I consider it a heresy that some sites (fuck
        ResearchGate, consider it fine to alter the
        PDFs. Document integrity should be the holy grail. Files
        should be final and never get touched. If they are, they
        are different.
          matthewmacleod - 3 minutes ago
          Wait, aren't those two statements opposed to each
          other?Different versions of a paper should have different
          DOIs. A DOI is fundamentally quite abstract, and there is
          no reason that an object-appropriate versioning scheme
          can't be laid on top. Figshare, for example, uses a
          versioning system where there is a single DOI referring
          to the overall artefact (e.g.
          10.6084/m9.figshare.2066037) and a versioned-by-suffix
          DOI referring to a specific version (e.g.
          10.6084/m9.figshare.2066037.v16). That works really well
  _delirium - 3 hours ago
  Kind of the opposite, sci-hub isn't really curated at all. Its
  goal is to have a PDF for everything that has a DOI, more or
  less. And the primary way of retrieving papers is to already know
  the exact paper you're looking for, found via some other search
  method like Google Scholar. It's not at all focused on
  categorizing or browsing papers, just slurping all of them into a
  big repository.
    Osmium - 3 hours ago
    > Kind of the opposite, sci-hub isn't really curated at all.
    Its goal is to have a PDF for everything that has a DOI, more
    or less.Side-stepping the politics and legality for a moment, I
    find it interesting how this is a very natural example of the
    fault-tolerant design of networks.A 'DOI' is a resource
    locator. There's a 'fault' in the network in that some people
    cannot locate the resource when providing the DOI. Sci-hub has
    sprung up to route around this fault, and provide people with
    the resource.Practically, there are real people making
    decisions who are involved in this process, but on an abstract
    level it feels like this is somehow inevitable? It feels like
    an emergent behavior from any sufficiently advanced network,
    and any attempt to stop it seems futile.
      pizza - 3 hours ago
      I guess another important part is that it's the universities'
      connection that scihub 'uploaders' tunnel through that are
      key - they have the special network access to DOI resources
      that make it free for on-site university users to get
      anything for free, and then the 'uploaders' relay them to
      outsiders. That's a difference between papers and something
      like 'scihub for any pdf ebook via ISBN' - there's no special
      network that can get all ebooks for free just via ISBN -
      except maybe the Library of Congress ;)
        mariuolo - 2 hours ago
        > I guess another important part is that it's the
        universities' connection that scihub 'uploaders' tunnel
        through that are keyDoes this happen in realtime? I read
        that sci-hub sometimes uses credentials from legitimate
        users, but in that case they would be easily identified.So,
        perhaps someone with access submits papers on request? And
        if so, what about watermarking?
          _delirium - 2 hours ago
          Plenty of the papers I've gotten from scihub are
          watermarked. The "downloaded by [IP] at [timestamp]"
          footer could probably be stripped, but they don't appear
          to do so, or at least not consistently.
          kanzure - 32 minutes ago
          > And if so, what about watermarking?years ago i
          recommended to scihub that they should use
 but they weren't
          too concerned.
  codemac - 3 hours ago
  We all miss oink.sci-hub is not like it, but it's more curated
  that tbp. You can enter a paper's URL or DOI and it'll take you
  right to it.I think there is curation that should be build on top
  of it, especially if the concept of "review" could be moved to an
  online system.
return0 - 4 hours ago
The Noah's Pirate Ark that will save all of humanity's knowledge
from unreliable publishers.
bogomipz - 2 hours ago
Can someone who's familiar with this research paper subscription
model that is threatened a la Elsevier explain to me how we got
here?I am curious if at one time did Universities publish these
independently and were they more accessible to the public? When did
this practice of restricting access to papers via subscriptions
  dougmccune - 34 minutes ago
  This long article about Robert Maxwell does a great job answering
  your question:
headcanon - 4 hours ago
The change won't be immediate though. I don't think universities,
which are journals' bread and butter, are going to stop their
subscriptions anytime soon. Stopping a journal subscription because
everyone is using sci-hub anyway (even if they researchers really
are on an individual basis) might open the door for copyright suits
against the universities, which would undoubtably be more expensive
than just keeping the subs going, especially since its just a line
item in an accountant's book. I'm sure it will happen eventually,
but journals might have enough time for some to pivot to some more
nuanced business model before they go bust.
  zzleeper - 3 hours ago
  There's a long tail with these subscriptions.So no one will drop
  their top-10 subscription, while expensive tail journals are
  probably doomed (tail journals are either very cheap and run by
  schools, or VERY expensive and managed by Elsevier).
  slaymaker1907 - 3 hours ago
  I doubt they would have a claim to make unless the university
  officially endorsed SciHub. Otherwise, how would the institution
  be expected to know that researchers didn't buy access
  wongarsu - 2 hours ago
  >might open the door for copyright suits against the
  universitiesHow so? The university will just say that they
  terminate the subscription to save costs (which is true), and
  they are not responsible for legal transgressions of each
  researcher. They just can't tell them "get your papers from sci-
  hub". Even the researchers themselves are only downloading, not
  distributing, which in many legislations is looked at quite
  favorably with comparatively small punishments.
  jamessb - 2 hours ago
  > I don't think universities, which are journals' bread and
  butter, are going to stop their subscriptions anytime soon.Around
  60 German universities have cancelled their contracts with
  Elsevier: http://www.the-, the
  stated reason for cancellation would be that costs or too high,
  not that everyone downloads papers from sci-hub.
    jcranberry - 2 hours ago
    As far as academic publication goes, Elsevier is literally the
    devil. Go 60 German universities.
  z1mm32m4n - 3 hours ago
  That being said, think about the other lines in the accountants
  books that could be better funded if universities didn't have to
  pay for journal subscriptions. That funding could go towards
  hiring more professors, paying professors better, hiring more
  research assistants, outfitting research labs better, etc.If we
  aren't paying researchers for peer review, the journal pay wall
  is just a net loss in productivity. It's just one more useless
    pishpash - 1 hours ago
    The funding would not go towards those things. If you
    understand anything about universities, it would go towards
    expanding the bureaucratic workforce.
    HarryHirsch - 2 hours ago
    if universities didn't have to pay for journal
    subscriptionsYou've misunderstood something there. With the
    "open access" model the costs are merely shifted around. In the
    traditional model the library would pay for subscription, now
    it's the researcher paying page charges for publication. In the
    past of society publishers the society had a reputation to
    lose, but Hindawi doesn't have such restraints on it.
      dgacmu - 1 hours ago
      In many fields, this change is a reflection of the shift in
      costs and responsibility for publication.  I'll speak of
      conference proceedings in CS, since that's what I know best
      (but these are roughly the equivalent of journals in other
      fields - peer reviewed, 10-20 pages per article, etc.)20
      years ago, the process involved the creation of a physical
      artifact -- bound paper, handed out to participants, mailed
      to subscribers, etc.  This is a fairly non-trivial
      undertaking, certainly costing quite a few thousand
      dollars.As of a few years ago, the last of the major
      conferences in my area stopped creating printed proceedings.
      Along with that goes away the need (desire?) to ensure
      precise formatting rules, etc. -- the job of the typesetter
      is gone.  We just submit PDFs, and everyone does their
      own.The other "costs" of a journal or conference were already
      borne by the research community -- most of our conferences
      and journals are all-volunteer.  It's a decentralized cost
      spread across the salaries of everyone in the community.In
      our model, at least, the role of the publisher is greatly
      diminished.  They provide some hosting, some indexing... and
      not much else.Not all fields are like that.  Science and
      Nature, for example, have paid editors.  Fine.  Happy to pay
      for that.The shift in costs happened a while ago - the costs
      are probably in the range of $10-$100 per paper now, compared
      to quite a bit more before.
      Mediterraneo10 - 1 hours ago
      > In the traditional model the library would pay for
      subscription, now it's the researcher paying page charges for
      publication.Not necessarily. In my own field (a branch of
      linguistics), many of our journals are open access, but they
      are still free to publish in. Some of the publishing costs
      are covered by the fact that these journals are put out by
      learned societies that are sitting on large endowments or
      receive state funding, and even for journals that are open
      access online, libraries often still want to pay for hard
    exhilaration - 3 hours ago
    ...if universities didn't have to pay for journal
    subscriptions. That funding could go towards hiring more
    professors...And more lawyers!  If the journals did sue the
    universities it would be a one time legal cost to defeat them
    (thereby driving them out of business) versus the ongoing and
    growing cost of journal subscriptions.
      teraflop - 3 hours ago
      Um, I know our legal system isn't perfect, but the outcome of
      a court case is still largely decided by, you know, actual
      laws and facts. You can't just throw money at some lawyers
      and assume you get to "defeat" whoever you want.I totally
      agree with the position that for-profit journals are bad for
      the research community, but is there any doubt that legally
      they have the right to charge universities for the content
      that they own the rights to?
      digikata - 2 hours ago
      Perhaps the universities should really look over the
      submitter contracts and see if they can directly grant open
      access to the university?s own past submissions. Some sort of
      collective group could help them share the cost of that legal
philipkglass - 3 hours ago
I had quite a bit of exposure to pirate journal archives before
sci-hub arrived. A couple of easy improvements that I saw with past
pirate libraries, that it'd be nice to have on sci-hub:- Strip
download watermarks ("Downloaded by Wisconsin State University on January 12, 2017 13:45:12"). Many times,
journals published by the same publisher do the watermarking
similarly so you need write just one pdftk (or other PDF
manipulation software) script for every journal under their banner.
At worst, it's a one-script-per journal effort.- PDF optimization.
A lot of publishers produce un-optimized PDFs that could be 25% (or
more) smaller with a completely lossless space optimization pass.
This should save storage/network costs for access to individual
papers and, more importantly, reduce the burden for bulk
mirrors.(I'd contribute the scripted passes myself if I had
contacts within sci-hub.)
  nickledave - 2 hours ago
  You've found watermarks in sci-hub PDFs? I hadn't noticed that
  but maybe I was too excited about being able to get the damn
  paper.You could tweet at them with a link to a Github repo of
  your scripts, they are active on Twitter
    philipkglass - 2 hours ago
    Yes, the example article I linked to on another comment has the
    name of the university and the download date watermarked. And
    that's on an article for a large, long-established journal;
    it's not like they're just missing watermarks on niche
    journals.Thanks for the tip about tweeting. I need to set up
    another github account disconnected from my professional
    identity but that shouldn't be too hard.EDIT: and maybe a
    separate Twitter account. And maybe both accounts used only
    from public wifi, too. I wouldn't put much past the publishers
    when it comes to getting revenge on people who help sci-hub.
    Unlike Elbakyan, I am not out of their reach.
kazinator - 53 minutes ago
They should expand into engineering: I don't see any IEEE or ISO
standards in there, for instance.
welder - 4 hours ago
Good riddance, limiting access to scientific articles is a
detriment to the advancement of humanity.
  isoprophlex - 3 hours ago
  The sooner all these assholes go out of business, the betterI
  hope scihub has a well thought out exit plan, in case of
  seizure.~ 40 M files, at 1 MB each (my own estimate). I hope they
  have backups / insurance files with all the papers collected this
  far. Given the data volume it's not trivial but surely not
    th0br0 - 3 hours ago
    They backup to Library Genesis as far as I understand it,
    Library Genesis is available via Torrents & Usenet -
      agumonkey - 2 hours ago
      the db dump is public too, from the tip of my tongue libgen
      forums quoted something like 100TB altogether. (this includes
      more than scihub cache)
      frgtpsswrdlame - 3 hours ago
      Yes, if you have a seedbox or something please host a few
      random parts! I have three or four hosted pieces and there
      aren't too many peers.
        icebraining - 3 hours ago
        Is there any way to tell which torrents have fewer seeds,
        without having to add them all to my client?
          stevenhuang - 1 hours ago
          I would like to know as well.
          frgtpsswrdlame - 1 hours ago
          I wasn't able to figure out a way so I just picked a few
          at random. Is there an easy way to roll up like a heroku
          app or something that would check the health of only
          those torrents? That could be really useful to the libgen
      nannal - 3 hours ago
      The IPFS network is ideal for this kind of situation.I should
      say I'm bias as I run but to host all 26gb there
      would not be expensive.
        wongarsu - 2 hours ago
        In which way is IPFS ideal?
        0x006A - 3 hours ago
        ipfs overhad is still way to big. also 26TB not 25gb.
          aw3c2 - 1 hours ago
          Overhead in what aspect?
TeMPOraL - 3 hours ago
I'm very happy to see SciHub going strong - for all the obvious
reasons. Now let's just hope they back up to IPFS (if they do, I'll
happily pin some of it).I want to go off a tangent here, though.
Now that open access (whether arXiv or SciHub style) is becoming
the norm, I wonder what can be done to improve the format of
scientific papers? Like e.g. making them more like this:http://worr of
regular PDFs?
  evv555 - 1 hours ago
  >Now let's just hope they back up to IPFS (if they do, I'll
  happily pin some of it).Looks like they've gone in the opposite
  direction.  Access to the torrent repository is no longer
  available.  The only way to download articles now is by clicking
  through ads.
    Arkanosis - 1 hours ago
    The torrent repository is available on libgen.
      evv555 - 1 hours ago
      Not for journal
  GuiA - 2 hours ago
  > I wonder what can be done to improve the format of scientific
  papers?See the Distill initiative:https://distill.pubHN
  gogopuppygogo - 2 hours ago
  An interactive/collaborative standard for viewing, annotating,
  and sharing notes is really needed in this space.  The technology
  exists to sit on top of the PDF files that are already created
  but a new standard to write and publish content is needed.
    neuromantik8086 - 57 minutes ago
    Funnily enough, I've been thinking lately that it might be nice
    for journals to publish annotated Jupyter notebooks or similar
    instead of conventional  prose-based methods sections.
  wongarsu - 2 hours ago
  I prefer PDFs. Easy to read, easy to print, no weird layout.
    andybak - 1 hours ago
    I hate PDFs. Hard to read, don't own a printer, weird layout.
      davesque - 1 hours ago
      I hate hating PDFs.  Hard to not read, don't not own a
      printer, unweird layout.  Disagreeing is fun.  Did I do it
  StavrosK - 3 hours ago
  I came here to say the exact same thing. A friend and I made a
  pinning service two weeks ago ( and we'd be happy
  to donate some space/bandwidth by pinning a subset of the papers.
  andrepd - 8 minutes ago
  What about the link you posted? It's... a paper with
  uncomfortably wide lines that hurt readability and grey text (why
  is it always grey) which ditto. The only interesting thing are
  the animations, but that's only really useful in a small
  percentage of works (even here it comes off as gimmicky) and you
  can just link it in the paper anyway.
  scrollaway - 3 hours ago
  Improving and advocating for standard methods of data publishing
  accompanying scientific papers would be great.  That and
  promoting open source (including open-sourcing the papers
  themselves, as in the source text and algorithms used to generate
  the accompanying resources etc).
  dwringer - 2 hours ago
  If you make an interactive website, it's no longer a "paper" and
  not subject to the same restrictions as peer-reviewed journals.
  There's no reason researchers couldn't be doing this now, except
  that their careers usually hinge upon their own journal
  publications (in spite of the existence of things like Sci-Hub).
  lucb1e - 2 hours ago
  I don't know what that link is, but after 10 seconds of loading
  over LTE I gave up in favor of my data bundle. I hope it doesn't
  go towards whatever that is.Personally I'm a big fan of blog
  posts: they're written for a broader audience in understandable
  language. I don't have any trouble reading English, but papers
  are almost universally written in a way that is more complicated
  than necessary. And in blog posts, if someone made a "novel new
  algorithm", at least you can be sure there's code, raw test data,
  screenshots, or whatever else is needed to DIY. And someone on
  the web is talking about it, perhaps even with comments below the
  post itself.
    tnecniv - 57 minutes ago
    > I don't have any trouble reading English, but papers are
    almost universally written in a way that is more complicated
    than necessary.This is a function of two things. The first is
    that venues often have strict page limits for their
    submissions. Authors typically have a lot to say and not a lot
    of space to say it, so they pick language that is precise,
    dense, and typically colorless. The second is that every domain
    has a lot of style and nomenclature that the layman won't know.
    It can be learned, but you must remember scientists write for
    each other, not for the layman.
      lucb1e - 15 minutes ago
      The first point: fair enough. I'd still see that as a
      shortcoming of the medium and something to be solved (rather
      than "just the way it is"), but that's reasonable.The second:
      I was talking about reading papers from my own field. That I
      don't understand a Biology paper (which indeed I don't --
      I've tried) is perfectly understandable, but infosec papers
      shouldn't (and don't) contain any unknown lingo to me. It's
      just a very convoluted way of writing.
    jtmcmc - 1 hours ago
    scientific papers and general blog posts have completely
    different audiences and intentions.The purpose of a paper is to
    be rigorous and exact and move the field of study forward. That
    tends to make them dense and use the fields jargon - which is
    short hand for massive amounts of information.
      Fordrus - 39 minutes ago
      While this is partially true, it is also DEFINITELY true that
      there is a large amount of academic posturing going on in the
      field of Molecular Biology, at least.  I've read MANY papers
      that could've been both more exactly and more simply written
      if they'd avoided needless jargon.  Yet my own experience
      with it indicates that they probably had to put in the jargon
      in order to get published- so much so that they may have been
      required to do a re-write or two to insert more 'academic
      language' to get accepted.  Quite annoying.
    TeMPOraL - 2 hours ago
    The link is to the Bret Victor's rewrite of a scientific paper,
    in which he introduces illustrations and interactivity for the
    important (and difficult) points of the paper.I edited the link
    to the more "lightweight" version (i.e. just the page, without
    loading his entire homepage as well, which is kind of heavy),
    so please consider trying again.I agree with you RE blog posts,
    and the point of me linking to Bret Victor's work is to give an
    example of a form that's better-suited to the media we operate
    with today. Papers still live in the paper age (pun not
      groby_b - 2 hours ago
      I love Bret's work, but I consider this rewrite pretty much
      entirely unreadable. I'm sure it's great for skimming - what
      with the bolding, and the flood of pictures - but that's not
      the point of scientific papers.
        tomjakubowski - 27 minutes ago
        It would be better with a layout that flowed only from top
        to bottom.  Reading text mixed with diagrams left-to-right,
        and then top-to-bottom, is hard, as you point out.Since
        Bret has liberated the scientific article from paper, we
        may as well take advantage of the more flexible layout
        possible with digital media.
  afandian - 1 hours ago
  Can I push back on the notion that "open access" can constitute
  pirated material (any more than the leaked Windows 2000 code
  makes Windows "open source"). Conflating the two things has been
  an anti-OA tactic in the past.(Disclaimer: Posting in a personal
    kazinator - 58 minutes ago
    Makes no difference if you aren't planning to redistribute the
    code or document (possibly as the basis of a derived work).If
    you could get the Windows source code with some paid
    subscription program, so that it's not pirated, it still
    wouldn't be open source. It would be more like "open
    access".Open source means we can modify it and share our
    modified version, and even charge for it.Most users of
    scientific papers aren't looking to extend those papers and
    redistribute modified copies; they just read them privately and
    make citations (which nobody can tell whether they were from a
    licensed or pirated copy).
      LambdaComplex - 18 minutes ago
      No, it would be open source. There's the source code. It's
      open; anyone can go look at it. Whether or not you can modify
      it without violating a license has nothing to do with whether
      or not you can read it.And this is exactly why Richard
      Stallman doesn't like the term.
        kazinator - 15 minutes ago
        In that case, pirated Win2K source is "open source". Anyone
        can go look at it.
    schoen - 1 hours ago
    I think more precisely you mean that unauthorized copies aren't
    "open access" in the usual sense of the OA movement (and many
    people want OA to be achieved through official licensing, not
    unofficial distribution). That is, it's the unauthorized copies
    that aren't OA.
  igravious - 2 hours ago
  whither the university?(1) MOOCs - student does not need to pay
  exorbitant tuition fees(2) Sci-Hub - student does not need access
  to a university library(3) ? universal accreditation - this piece
  is missing===idea for start-up: aggregate MOOCs, package
  instructions on how to retrieve information online, connect
  instructors and tutors to students, arrange accreditation, offer
  BA, MA, PhD programs, we have start-ups in every industry but
  higher level education, could it be possible? ?
    Eridrus - 1 hours ago
    MOOCs are very spotty. You may be able to do this for some of
    CS, but it would be tough to put together a complete high
    quality degree in anything else.
  avip - 1 hours ago
  I don't know but _please_ let be something I can print on real
  paper and sketch on.
  tnecniv - 1 hours ago
  Writing papers as they are now is already a labor-intensive and
  arduous process. That link is great [1], but producing such a
  thing would add quite a bit of time to the paper cycle. Besides,
  many people still like to print papers out...[1] because it's
  Bret Victor, of course
sonium - 3 hours ago
This will be a catalyst for open-access
  Spivak - 3 hours ago
  Yeah, but open access is just 'stuff the cost of publishing into
  the grant application' and because journals make money for each
  work published it encourages rubber stamp reviewing and
  publishing noise.Open access is probably a net good, but it just
  shifts the costs around.
agumonkey - 2 hours ago
Anybody mirrored (or attempted to do so) libgen ?
philipkglass - 3 hours ago
I don't think that sci-hub is going to kill off institutional
journal subscriptions in the developed world. It's similar to how
developed-country universities didn't stop buying licensed software
and start passing around cracked versions to their faculty and
students. Journal revenue isn't going to plummet like CD sales
after Napster, because it's not individuals doing most of the
purchasing in the first place.Individuals and institutions in poor
countries may well turn to sci-hub. I certainly have. But I would
venture that not much of the journals' revenue came from
individuals or poor institutions in the first place. I didn't pay
to read paywalled papers before sci-hub either; I got them via
authors' sites or personal contacts, or just didn't get to read
them at all.
  ballenf - 3 hours ago
  Tend to agree. There might even be an argument that SciHub
  provides something of a pressure release valve that will allow
  paywalls to continue. Similar to how pirated Windows copies can
  be said to have helped solidify Windows' market share. Or even,
  in my own mind, how pirated Adobe applications helped people
  learn the tools and go on to work at companies with legitimate
  licenses.Elsevier, et al, can now make a legitimate claim that
  they are not restricting access to those who cannot afford a sub.
  But their tax on academia will continue.
vbuwivbiu - 3 hours ago
and it's better than all of their websites!
sillysaurus3 - 3 hours ago
I was surprised that it's still considered rude to link to sci-hub: know
if this is a typical sentiment? I'm just curious if it's true that
many researchers are offended by this movement, and what the
reasons are.I firmly believe that there are always two sides to any
topic, so we should explore the flipside. What are some arguments
against blatantly opening up access to paywalled articles?
  carbocation - 3 hours ago
  If someone were to post a link to a pirated version of one of my
  academic publications in a Hacker News discussion with me, I
  would be relieved that I didn't have to do it myself to let
  people see it.
  kken - 2 hours ago
  Well, this is linking to IEEE. I have mixed feelings about this,
  since IEEE is actually doing a good job about publishing. They
  have far better reviews than most other journals, and members
  free get access to most journals anyways.
  currymj - 3 hours ago
  further down, the author in question says he supports sci-hub and
  is happy to see it linked so that more people can read his work.
  he was just surprised that someone would post a link so blatantly
  to a pirate site. on the other hand, he says that he knows
  researchers who would be upset by this but doesn't give their
    sillysaurus3 - 3 hours ago
    Yeah, I should've clarified that I was curious about the people
    he mentioned. Researchers contribute some of the most valuable
    comments to HN, so mainly I wanted to avoid making them feel
    unwelcome. If linking to sci-hub ends up shooing them off HN,
    it's not worth the cost.It seems like the sentiment is in the
    other direction, though. Maybe most researchers don't care.
  isoprophlex - 3 hours ago
  I was a small time academic once, and I shared all my stuff by
  linking to scihub.My university paid 500-2000? / article in
  extortion errrrr i mean publishing fees. That should be more than
joelthelion - 3 hours ago
If only. I'm convinced they will find a way to shut her down.
turc1656 - 6 minutes ago
Looks like Aaron Swartz's vision for the free, collective ownership
of mankind's scientific knowledge is well on its way.  I wish he
were still alive to see Sci-Hub in action.
andrepd - 5 minutes ago
Thanks! That reminds me I should donate to Sci-Hub!
sixdimensional - 3 hours ago
So, fundamental question here - if scientific articles (or anything
that can be copy protected, etc.) can be released online in this
manner to "free the knowledge", and yet, given such free access,
there are still people that will pay for a subscription to access
the same scientific articles, wouldn't that be the best solution?I
see people commenting that just because of this release,
universities won't cancel their subscriptions to the journals.
Well, that would be great - let them keep paying, while the content
also gets out for free.This is like the trend where you can pay
what you want for stuff, or nothing.  I wonder if that model would
apply to scientific research - pay what you want for the paper, or
nothing - but if you want to support that research.. hopefully
people would still pay.Just thinking out loud... probably already
been thought of or wouldn't work (or I'm just self-defeatist). :)
  notyourday - 3 hours ago
  Let me give you an unpopular answer -- outside top 500 scientists
  across all the fields combined no one produces quality papers.-
  the manuscripts received by EICs are garbage. EICs themselves
  rarely touch anything, or edit anything.- "peer review" process
  in all non-the-most-upper-tier publication is a joke- copy-
  editing and proofreading is non-existentAbout 15 years ago a lot
  of journals that are now owned by the major publishers were
  society publications. This means that societies owned the title,
  owned the copyright and owned the process. Societies could not
  find people capable and willing to run a journal for $5k or so a
  paper including distribution and printing. So the societies went
  to the likes of Springer, Informa, T&F, Elsevier etc. Those said
  "Ok, sure. $2k per paper and we produce and distribute it or $5k
  per paper and we do everything". That was too much for societies.
  Instead the societies said said "Hey, what if we sold you the
  rights to the journal? Would you in that case do all of it for
  free, and let our EIC suck his or her thumb while still being the
  man/woman on the title page?" "Of course" said the publishers.And
  so now we are here. Production costs did not go down.
  Distribution costs did not go down. In fact, distribution costs
  increased because before that the journals were printed by a
  little printers in the US as the volume of most of journals is
  microscopic ( later printing went to China in the same
  microscopic quantities ). Now, however, journals also need to be
  distributed in all kinds of wacky XML formats on all stages of
  production, which needs to be coded, in most cases by hand.So
  unless every Joe, Jack and Jill, the scientist, wants to go back
  into the publishing world nothing is going to change.
    majewsky - 2 hours ago
    > outside top 500 scientists across all the fields combined no
    one produces quality papersJust to make sure I read this
    correctly: Are you saying that, when judging by paper quality,
    there are only 500 good scientists on Earth?
      notyourday - 2 hours ago
      Only about 500 produce readable manuscripts to start.
      Publishers have their names because it changes schedules that
    sixdimensional - 2 hours ago
    A root cause there would be the opportunity cost the
    scientist/society calculates to publish themselves vs have a
    publisher do it.The equation today isn't the same - with open
    source / community effort, I suspect the cost/effort of
    publication today doesn't even come close.I was just randomly
    looking at what it would cost (rough estimate) for 25TB of S3
    storage - 2,000,000 put requests a month, 2,000,000 get
    requests, 25TB bandwidth OUT and 25TB bandwidth IN - and it's
    less than $3,500 per month. So the cost of hosting the
    published item seems actually quite reasonable... reducing the
    cost of the rest of the "publication" plumbing are problems
    that technology also helps address.
      notyourday - 2 hours ago
      That's not the cost. The cost is to take a garbage paper with
      broken figures, broken text, in a barely parse-able English,
      written by someone who does not believe in citations or
      attributions, does not follow Chicago and produce a paper
      that is being distributed.
        sixdimensional - 2 hours ago
        Agreed that the best publishers act as both a filter and
        improve the production quality of the papers, and that this
        is a true cost.  I'd hope that they could continue to do
        what they do and also get paid by their subscribers.
        Ideally, they could do that AND the works could be
        published for free, and those who value their efforts would
        in turn reward the publishers for their efforts as well by
        subscribing to the paid version of their publications.That
        said, Wikipedia mostly works.  Between professional editors
        and the community, decent knowledge is categorized, edited
        /peer-reviewed and interlinked.  Why the same cannot be
        done with academic papers is beyond me, other than to
        assume people simply don't want to change the status quo.I
        also agree with your last point - so long as authors can
        contractually publish their own work, they should - and the
        Internet should make it as easy as humanely possible.  I've
        published a paper before to an academic journal and had
        that clause, and then put it online on my own site as well
        (until I took my site down).Random thing - I do think the
        standards of what constitutes knowledge matter, but boy do
        we hold them so high.  I think there are many forms
        knowledge comes in, and expecting them to all be polished
        perfection is perhaps too lofty a goal.  Knowledge is
        always a work in progress.  Discerning between fact and
        fiction is the same whether you have a polished paper or a
        garbage one, it's just one is a lot easier to consume and
        you have more trust inherent by the nature of the
        publisher's reputation.
  JoshTriplett - 3 hours ago
  I'd rather see that money put into actual research rather than
  paying for access to free things. And approximately none of those
  funds go to pay for research.
    agumonkey - 2 hours ago
    in a way researchers paying for reading research is an absurd
      sixdimensional - 18 minutes ago
      Therefore, should the results of all research be made free
      and public?  I was hoping we could allow people to pay if
      they wanted but also get it for free, and have both be
    sixdimensional - 3 hours ago
    Agreed.. is that like saying that researchers should do a "pay
    what you want for my paper" online and self publish/host the
    knowledge?  Maybe somebody just needs to provide a standard
    "pay what you want" feature that academics can embed easily
    into their own site, and then self-publish / host.
      Spivak - 3 hours ago
      Do you think pay to cite would be a good model?
        sixdimensional - 3 hours ago
        Hmm, that's interesting - I think maybe that's just like
        licensing, right?  Except in this case, the licensor is the
        researcher/author and the licensee is the author citing the
        source?Combining the two thoughts, "suggested payment to
        cite" with a "pay what you want" model could interesting
        too.I suppose this would be a direct transfer of value from
        those who want to build knowledge on other people's work,
        to those who did the work.  As long as it was not unduly
        expensive to do so, maybe - after all, the saying goes
        "paying my dues".  I would think you wouldn't want to
        inhibit or slow down people from building on knowledge
        either (which is what things like Sci-Hub seem to be trying
        to avoid).I wrote a few published papers some time ago, and
        I was told that without citations, a paper would be
        rejected as academic research should always be based on
        enhancements or references to prior work.  So it seems kind
        of built in to the mechanism that citations are the
        requirement to build knowledge on top of when creating such
        works.It would be interesting to see how a model like this
        could work.  Since the value created by the researcher is
        essentially part of a web of value, it might be hard to
        determine who should get credit.For example, we have 3
        existing papers, A, B and C, and one new paper, D.  Paper A
        cites paper B, which cites paper C - and all of them are
        additive to our knowledge base.  Therefore, as the author
        of paper D, if we were to pay to cite paper A, should that
        also include some payment to the authors of paper B and C
        too?I suppose one addition you could add to this - payment
        to only LIVING researcher(s)/author(s).  If the
        researcher/author is deceased, then the payment stops.  In
        this regard, it sounds like royalty/licensing fees.
        JoshTriplett - 2 hours ago
        No, not at all.  Nor would models like "pay into a pool and
        get paid based on citations", either.  That'd create
        perverse incentives, not least of which more incentive to
        push for citations to your own works when doing review.
drewda - 1 hours ago
I'm all for Sci-Hub disrupting the dominance of RELX Group (a.k.a.
Elsevier) and other for-profit publishers that make such a big
profit off the backs of researchers (who write and edit for free)
and grant-making organizations (who fund those researchers).But
it's unfortunate that Sci-Hub is also disrupting non-profit
scholarly associations that cover their own budgets through journal
subscriptions. In these cases, the fact that libraries and readers
have to pay for access to an article is somewhat balanced out by
the fact that those fees are going to pay for staff, conferences,
and the other worthwhile activities of the non-profit associations.
darawk - 1 hours ago
The death of for-profit scientific journal companies will be a
beautiful thing for the world. It's really rare to see something
that is so purely valueless. This industry is sort of unicornlike -
they've managed to extract rents in an area where they add
literally zero value. It's truly an amazing thing, and it will be
even more amazing to watch it die.
revelation - 2 hours ago
Does Sci-Hub actually have all the papers or are they just
retrieving them on-demand?Publishers are tracking mass downloads
(see the Aaron Swartz case) so given some of the very obscure
papers I've retrieved from Sci-Hub I assume it's unlikely they
downloaded them beforehand. My go-to assumption for how it works is
that a bunch of people have donated access to their university
network access and Sci-Hub is just a load-balancing / cache layer.
  philipkglass - 2 hours ago
  Yes, it lazy-loads papers using credentials from institutional
  subscribers and then stores them for fast retrieval. When you're
  the first person to request a paper you'll see an animation of a
  biphenyl molecule rotating while the site fetches the paper from
  an institution with access. Sometimes, there is no corresponding
  institution with access currently hooked up to sci-hub and the
  retrieval process fails. But I've only seen that happen a few
mcappleton - 2 hours ago
It's not just the publishing industry that is the problem. It is
merely a symptom of the greater malaise in higher education as a
whole.The focus is on degrees, not on true learning. So much of
what occurs is in universities is total waste. But people put up
with it to get the paper. As long as people keep blindly giving
absurd sums of money to get the paper, these expensive publications
will last. The answer is for people to wake up and value learning
over a diploma. When that happens, then finally issues like this
will go away. Heck, as a bunch of people have pointed out, many of
these papers aren't even for real learning. They are worded in such
a way as to make them sound smart to their peers, but
unintelligible to the public.
biomcgary - 3 hours ago
I've met the author of the study, Daniel Himmelstein, who is quite
passionate about making information free. Projects in his github
account ( tend to use a CC0 license.
Some of his work involves aggregation of data (e.g., that is encumbered and he has
put a lot of effort into making it as free as possible.  His
project carefully documents the license for each data point and he
took the time to ask copyright holders that do not provide an
explicit license to do so.
dekhn - 3 hours ago
The origin of the web was to disseminate scientific knowledge.  The
guardians of that knowledge- the journal publishers- have
absolutely failed to make a viable business model out of this,
while many companies who adopted the web made billions.While I do
not use Sci-Hub, I think that users who use it are doing so morally
and ethically (in the sense of conscientious objection).  i hope
they are also willing to pay penalties if they are found to be
violating copyright (this is generally considered a requirement for
intential protest).
  TeMPOraL - 3 hours ago
  SciHub shows the way papers should work on the Internet.The other
  day in a HN discussion, someone cited a paper in response to my
  comment. I was able, in 30 seconds, get to the full text of that
  paper, which allowed me to reevaluate my opinion in context of
  what I read.This is how science can, and should be useful for
  individuals. And beyond arXiv and SciHub, it generally isn't.
    benbreen - 3 hours ago
    I'm an academic and fully making research open access. But when
    I read discussions like this I always wonder about the people
    who work at journals. The process of peer-review, copy-editing,
    and online publication is not something that can be done for
    free.Granted, the current journal publishers spend too much
    money on overhead, and I certainly don't support the for-profit
    ones like Elsevier that rake in huge profits. But I also don't
    see much allowance made for the fact that publishing research
    in a peer-reviewed format involves labor which should continue
    to be compensated in some way (incidentally, it's not entirely
    true that researchers themselves aren't compensated -
    publishing offers an indirect benefit but a real one in the
    sense that publications are directly linked to salary increases
    down the line).
      wbl - 3 hours ago
      MSP does all of this for quite reasonable rates.
      pizza - 3 hours ago
      Would it make sense for the peer review to be uncoupled from
      the distribution? I don't know about if this were physical,
      but, digitally, if e.g. ACMEcorp serves the paper, and if
      review team 1, team 2, etc.. can all attach their signatures
      of peer review in e.g. PeerDB, doesn't that make the review
      more transparent and detangle incentives?
      WalterSear - 3 hours ago
      > The process of peer-review, copy-editing, and online
      publicationI'm confused that you aren't aware of this but,
      peer review and copy-editing is by-and-large done by other
      academics, not journal publishers, and, at most, for what
      amounts to an honorarium.And online publication is not a job,
      per se. We automated it a long time ago. Teenages have tumblr
      blogs now. There is no reason why the practical aspects of
      online journal curation could not be handled by a very small
      team of people working in the IT departments of a few
      universities.Journal article publication may contribute to
      academic careers, but that has nothing to do with the
      publishers' involvement: it has to do with the quality of the
      journal, which is driven by the academics in writing and
      reviewing for it.Simply put, journal publishers are
      >entirely< overhead.
        benbreen - 2 hours ago
        See my comment below. Copy-editing isn't performed by other
        academics (or at least it shouldn't be given their other
        responsibilities, in my view).And although peer review
        relies on specialists volunteering their time, finding and
        vetting those specialists still requires work.I'm not
        trying to say that the current publishing model is
        defensible, but I am pointing out that running a high
        quality peer reviewed journal still requires at least one
        or two dedicated workers. Whether you think they should be
        paid for their time or expected to volunteer is a different
        issue, but we shouldn't pretend that the whole apparatus is
        an illusion created by greedy publishers.
          dekhn - 2 hours ago
          I always - always - sent my paper to at least one non-
          coauthor for a final copy-edit before being
          submitted.Also, no editor at any journal (I've published
          ~20 papers) made any edits to my papers.
          benbreen - 1 hours ago
          This must be highly field-specific then. I published a
          peer-reviewed paper a couple months ago that came back
          with around 50 suggested copy edits, as well as a few
          paragraphs of suggested changes from the journal editor.
          And then it went through the process again in a lesser
          form at the page proofs stage. Granted, a lot of those
          suggested edits were to make it conform to a somewhat
          arbitrary and tedious house style, but it also caught
          things that I or the other people I shared the paper with
          didn't see.
          dekhn - 1 hours ago
          Oh, I didn't include edits to stay within house style,
          but then, I wouldn't submit a paper that wasn't already
          in house style.If the editor sent some copy edits to the
          text, I'd just send it back to them unedited and ask them
          to publish it.  In fact, I love pushing back against
          unreasonable editorial requests.
      peteretep - 2 hours ago
      Napster apparently forged a reasonable business model for
      music publishers, let's hope this forges one for journals.
      JoshTriplett - 3 hours ago
      > But when I read discussions like this I always wonder about
      the people who work at journals. The process of peer-review,
      copy-editing, and online publication is not something that
      can be done for free.Peer review is done by others in the
      field (peers), typically for free. Online publication is
      "where do I stick this PDF", and does not require per-paper
      work (or if it does that can be done by the author). That
      leaves us with copyediting, and in many cases, copyediting
      issues are caught by peer review rather than any paid editor.
        benbreen - 3 hours ago
        I do peer review myself and am familiar with the model.
        IMO, when I'm contacted to review someone's work, the
        journal employee contacting me is performing a legitimate
        service. They did research to find my name and email and
        determine that I'm competent to assess the paper. They or
        another editor have also reviewed the paper in the first
        place to determine if it's worthy of being peer-reviewed at
        all, which requires some domain-specific knowledge. And if
        I pass on peer reviewing, they have to find another person
        to ask, and so on. Multiplied by dozens of papers, that can
        be a substantial amount of work.I also think that you
        underestimate the importance of copy-editors. It's not the
        job of a peer reviewer to make sure that the author uses an
        apostrophe properly, etc. There needs to be a specialist
        who is dedicated to catching those errors, particularly
        since, as you note, peer-reviewers aren't directly
        compensated so it's unfair to burden them with a whole
        other set of responsibilities.
          wongarsu - 2 hours ago
          Even if we don't put all the copy-editing burden on the
          author (it's their reputation that is affected by the
          mistakes), the costs for organizing peer review and copy-
          editing could be covered by a fairly small submission
          fee, or alternatively donations or the sale of hard-
          copies. You could even offer freemium models where anyone
          can read the papers for free, but value-add options are
          sold to libraries and universities (integration into
          library catalog, better search, etc).
          benbreen - 1 hours ago
          I think something like the freemium model you mention is
          the way to go. As others have mentioned in this
          discussion, the alternatives simply rely on pushing the
          costs to different sectors (like funding agencies or
          even, in the worst case scenarios, researchers
          themselves). I keep waiting for this sort of thing to
          happen. Perhaps it could even be bundled into some kind
          of social network that would offer an alternative to
 It seems that there is a lot of inertia
          when it comes to scholarly publishing though.
          Mediterraneo10 - 1 hours ago
          > I also think that you underestimate the importance of
          copy-editorsMany Elsevier and Springer journals no longer
          perform copy-editing. Authors are expected to have their
          paper checked by a native English speaker and copy-edited
          at their own expense, and then provide the journal with a
          camera-ready PDF.
          amelius - 2 hours ago
          Let me rephrase that a little. In your first paragraph
          you argue that the work journals actually do is finding
          others to do the real work. And in the second paragraph
          you say that the copy editor is there to catch missing
          apostrophes. It's true that that is not "zero" work, but
          it's not a very strong case. And it certainly does not
          justify the absurd cost model we are currently stuck
          benbreen - 1 hours ago
          We agree, it absolutely doesn't justify the current cost
          model. I hate having to donate my time to Elsevier as
          much as the next academic.Maybe I gave the wrong
          impression by mentioning apostrophes, however.
          Professional copy editing is, in my view, super important
          in terms of differentiating a good journal from a bad or
          mediocre journal. As is the vetting procedure of finding
          appropriate peer reviewers and coordination between them.
          Whether or not you think of that as "real" work compared
          to producing actual research, it is still work that
          should be compensated in some way, in my view.An analogy
          might be the professor teaching a class vs the
          maintenance guys who makes sure the projectors are
          working and the lights turn on. One might be more
          important than the other, but I don't think either should
          be working for free.
          dgacmu - 1 hours ago
          > There needs to be a specialist who is dedicated to
          catching those errors,I think "needs" might be too strong
          here.  We (the field of CS) get by without it just fine
          -- the standard practice is to include copy-editing
          "nits" at the end of one's review.  A shepherd, assigned
          during the final phase, does a final pass on the paper
          before approving it.Yup.  Typos slip through.  There are
          papers with poor English.   Oh well.  For the most part,
          it works out pretty well.(And as a reviewer, I have
          little objection to also noting writing fixes while I'm
          reading your paper.  I'm going to spend anywhere from 30
          minutes to 5 hours reading the thing -- the writing fixes
          are a small additional cost.  If you've done a decent job
          on the writing in the first place.  If it's totally
          botched, I'll reject your paper and tell you to fix it
          before submitting it again. :-)Now, would I prefer that
          the authors of submitted papers had to pay $50 for
          someone to do a copy-editing pass before I reviewed it?
          Heck yes.  But perhaps we'll get DNNs to fix this for us
          one of these days. :)
          benbreen - 55 minutes ago
          That's a fair point. One thing I'm getting from this
          discussion is that it's difficult to generalize when it
          comes to academic publishing, because norms vary
          substantially between fields. I've seen the copy editing
          "nits" you mention at the end of reviewers' letters in my
          field (history) but I suspect that historians would rebel
          if the copy editor's job was entirely foisted off on
          us.Likewise, it's normal for editors in my field to make
          meta-level suggestions about writing style. I'd wager
          that history journals place a greater emphasis on prose
          style than CS journals do, since making an historical
          argument often depends on telling a compelling narrative.
          Hence a publishing model that works for a CS journal
          might not work for humanities journals and vice versa.
        slaymaker1907 - 3 hours ago
        @benbreen even if some papers vet peer reviewers, I've
        heard many just use suggestions for reviewers provided by
        the author...
    dekhn - 3 hours ago
    Yes, I agree completely.  I'd hope that the arXiv model would
    win - making SciHub unnecessary in the process.  It hasn't yet.
  agumonkey - 2 hours ago
  Also if you're motivated and dig well enough, you'll find plenty
  of copies on college classes lectures websites. Albeit nowhere
  near scihub but still..
fsloth - 4 hours ago
Basically, the publishers asked for this. Denying open access to
old papers from humanitys point of view is wastefull. The planet is
full of hungry minds. Who knows where the next Ramanujan comes from
and which discipline he or she chooses but given the non existent
transaction cost of reading an old paper it would be beyond silly
if they could not do it for free.
  LeifCarrotson - 3 hours ago
  Publishers can provide value, and should not be forced to do so
  at a loss. Peer review, curating for quality, editing,
  typesetting, and creating physical copies could be
  expensive.True, current publishers don't compensate peer
  reviewers, limit curation to the set of people who will pay their
  submission fee, force editing and typesetting back on the
  authors, and charge egregious fees disproportionate to the cost
  of distribution. But the concept of the business isn't invalid.
    infogulch - 2 hours ago
    Nobody cares if publishers could theoretically add value in
    some alternate universe. In practice, none of them do.This
    isn't throwing the baby out with the bath water, this is people
    trying to stop this nasty ass bath water from being thrown out
    because there used to be a baby in it.
      paulgb - 2 hours ago
      Wonderfully said.
    moyix - 1 hours ago
    Yeah, just to spell out how things work in CS for the things
    you mentioned:> Peer reviewOrganized and performed by
    volunteers.> curating for qualityDitto.> editing,
    typesettingDone by authors (LaTeX isn't perfect, but it gets
    you "good enough" typesetting. And the last time a journal
    edited a paper of mine they mangled it because the person
    editing wasn't familiar with technical topics & jargon).>
    creating physical copiesNo one needs these any more; they just
    print the PDF if necessary.
    fsloth - 1 hours ago
    Sure, I think organizing the peer review process has some
    merit. I don't have an opinion if that's the optimal way to do
    it. Thus I wrote that older papers should be available for
    free. If not hosted on the journal servers then available free
    of copy right issues elsewhere.
    mirimir - 38 minutes ago
    Sure, they can. If they don't extract monopoly-level rents.
    4bpp - 2 minutes ago
    Nobody is talking about forcing publishers to do anything,
    though. If demanding free access to electronic copies of papers
    actually makes their business untenable as they claim, they
    should put their money where their mouth is and shut it down;
    at that point, based on what will replace it, we will see how
    much value they actually added to society.
  mirimir - 40 minutes ago
  Yes, they priced themselves out of their market.