GOPHERSPACE.DE - P H O X Y
gophering on gopher.petergarner.net
petergarner.net gopher root
petergarner.net Cybertech root

 --
 -- A fine collection of Technically-oriented PDFs (Papers, Specs,
 -- Decks, Manuals, etc) compiled by Trent Nelson and dehain
 --
 -- Visit Github for the full set which also includes non-PDF files
 --
 -- Links: https://github.com/tpn/pdfs
 --        https://github.com/tpn
 --        https://github.com/dehain
 --

100G Networking Technology Overview - Slides - Toronto (August 2016)
2018 CppCon Unwinding the Stack - Exploring how C++ Exceptions work on Windows - James McNellis
nding_the_Stack_-_Exploring_how_C++_Exceptions_work_on_Windows_-_James_McNellis.pdf
37 Million Compilations - Investigating Novice Programming Mistakes in Large-Scale Student Data (fp1187-altadmri)
5-Level Paging and 5-Level EPT - Intel - Revision 1.0 (December, 2016)
5-Level Paging and 5-Level EPT - Intel - Revision 1.1 (May, 2017)
ion_1.1_(May,_2017).pdf
A Block-sorting Lossless Data Compression Algorithm - May 10th, 1994 (SRC-RR-124)
A Brief Introduction to Neural Networks (neuronalenetze-en-zeta2-2col-dkrieselcom)
A Brief Introduction to the Standard Annotation Language (SAL) - 2006
A Brief Tutorial on Database Queries, Data Mining, and OLAP (hamel-197-manuscript-final)
Abstract Algebra - 2016 (aata-20160809-sage-7.3)
Abstract Rendering - Out-of-core Rendering for Information Visualization (2014)
Abusing Mach on Mac OS X - May, 2006 (uninformed_v4a3)
f
A Case Study in Optimizing HTM-Enabled Dynamic Data Structures - Patricia Tries (2015)
A Catalogue of Optimizing Transformations (1971-allen-catalog)
Accelerating Network Receive Processing - Intel IO Acceleration Technology (ols2005v1-pages-289-296)
Achieving Full-Motion Video on the Nintnedo 64 -GDM (September 2000)
A Comparison of Programming Languages in Economics (16-Jun-2014)
A Comparison of Software and Hardware Techniques for x86 Virtualization - Oct 2015 (asplos235_adams)
A comparison of SPDY and HTTP performance - Microsoft Research (2012)
A Compilation Target for Probabilistic Programming Languages - 2014 (paige14)
stic_Programming_Languages_-_2014_(paige14).pdf
A comprehensive study of Convergent and Commutative Replicated Data Types
A Comprehensive Study of Main-Memory Partitioning and its Application to Large-Scale Comparison- and Radix-Sort (sigmod14I)
gmod14I).pdf
A Compressed Suffix Tree Based Implementation with Low Peak Memory Usage (2014)
mplementation_with_Low_Peak_Memory_Usage_(2014).pdf
A Course in Machine Learning (ciml-v0_9-all)
A Crash Course in x86 Assembly for Reverse Engineers - SensePost (2014)
Adaptive Insertion Policies for High Performance Caching (ISCA-2007-Qureshi-SetDuelingControl)
Adaptive Ray Packet Reordering - 2008 (reorder_rt08)
Adaptive String Dictionary Compression in In-Memory Column-Store Database Systems (2014)
Adding Lock Elision to Linux - Slides (2012)
AddressSanitizer - A Fast Address Sanity Checker (atc12-final39)
A Detailed Analysis of the Component Object Model - 1989 (Muijadi_okstate_0664M_1681)
A Dive in to Hyper-V Architecture and Vulnerabilities
A Dive in to Hyper-V Architecture and Vulnerabilities - Slides (BlackHat 2018)
A Durable Main-Memory Index Using Flash
Advanced Bloom Filter Based Algorithms for Efficient Approximate Data De-Duplication in Streams - 17th Dec 2012 (1212.3964v1)
Advanced Data Structures - MIT 6.851 (2012)
Advanced Topics in CUDA - Slides (2011)
Advances in Cloud-Scale Machine Learning for Cyber-Defense - Russinovich 2017 (exp-t11-advances-in-cloud-scale-machine-learnin
-for-cyber-defense)
Advances in Memory Management for Windows - October 12, 2007 (136_MemMgt)
ows_-_October_12,_2007_(136_MemMgt).pdf
A Family of Perfect Hashing Methods - 1996 (TR0242)
er.petergarner.net
A Faster Cutting Plane Method and its Implications for Combinatorial and Convex Optimization - MIT - 2015 (1508.04874)
A Fast, Minimal Memory, Consistent Hash Algorithm (1406.2294)
A Fast, Minimal Memory, Consistent Hash Algorithm (1406.2294v1)
m_(1406.2294v1).pdf
A Fast x86 Implementation of Select - 2017 (1706.00990)
A Few Billion Lines of Code Later - Using Static Analysis to Find Bugs in the Real World - ACM - 2010 (BLOC-coverity)
h/tpn/A_Few_Billion_Lines_of_Code_Later_-_Using_Static_Analysis_to_Find_Bugs_in_the_Real_World_-_ACM_-_2010_(BLOC-coverity).pd
A Few Experiments with Intel's Cache Allocation Technology - Slides (2015)
Affinity Accept - Improving Network Connection Locality on Multicore Systems
A File Comparison Program - 1985 (10.1.1.189.70)
A File is Not a File - Understanding IO Behavior of Apple Desktop Applications (2011)
erstanding_IO_Behavior_of_Apple_Desktop_Applications_(2011).pdf
A First Encounter with Machine Learning - 2011 (IntroMLBook)
A Forensic Analysis of CSG 11 Encounter with an Anomalous Aerial Vehicle
A Framework for Building Extensible C++ Class Libraries - 1993
Agner Fog - Calling Conventions for different C++ compilers and operating systems (2013-09-04)
ng_Conventions_for_different_C++_compilers_and_operating_systems_(2013-09-04).pdf
Agner Fog - Calling Conventions for different C++ compilers and operating systems (2017-05-01)
ng_Conventions_for_different_C++_compilers_and_operating_systems_(2017-05-01).pdf
Agner Fog - C++ vector class library (2013)
Agner Fog - C++ vector class library v2 (2019)
Agner Fog - Instruction Tables (2013-04-03)
Agner Fog - Instruction Tables (2018-04-09)
Agner Fog - Microarchitecture of Intel, AMD and VIA CPUs - An optimization guide for assembly programmers and compiler makers 
Agner Fog - Microarchitecture of Intel, AMD and VIA CPUs - An optimization guide for assembly programmers and compiler makers 
Agner Fog - Optimizing Software in C++ (2014-08-07)
er.petergarner.net
Agner Fog - Optimizing Software in C++ (2017-05-02)
er.petergarner.net
Agner Fog - Optimizing Subroutines in Assembly Language - An optimization guide to x86 platforms (2013-09-28)
ner_Fog_-_Optimizing_Subroutines_in_Assembly_Language_-_An_optimization_guide_to_x86_platforms_(2013-09-28).pdf
Agner Fog - Optimizing Subroutines in Assembly Language - An optimization guide to x86 platforms (2017-05-01)
ner_Fog_-_Optimizing_Subroutines_in_Assembly_Language_-_An_optimization_guide_to_x86_platforms_(2017-05-01).pdf
A GPU-friendly Skiplist Algorith - 2014 (GPUSkiplist)
A History of Modern 64-bit Computing - Feb 2007 (CSEP590A)
Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Machine Learning - 2019 (math-deep)
19_(math-deep).pdf
Algorithms for Random 3-SAT
Algorithms for Routing Lookups and Packet Classification - PhD Thesis (Pankaj Gupta, 2000)
A Little Journey Inside Windows Memory
Allocation Removal by Partial Evaluation in a Tracing JIT - 2010 (bolz-allocation-removal)
Almost Random Graphs with Simple Hash Functions - Slides (2007)
A Locality-Sensitive Hash for Real Vectors (10.1.1.215.7690)
A Lock-Free Wait-Free Hash Table - Slides (070221_LockFreeHash)
A Look at Intel's Dataplane Development Kit (2014)
Alpha AXP Architecture - 1992 (vol4num4art1)
Alternating Coding and its Decoder Architectures for Unary-Prefixed Codes - PhD Thesis, Shang Xue (2005)

A Malloc Tutorial (Feb 16, 2009)
A Mathematical Theory of Communication (1948)
A Mathematician's Lament - Paul Lockhart
AMD64 Architecture Programmer's Manual - Volume 1 - Application Programming (24592, r3.21, Oct-2013)
tecture_Programmer's_Manual_-_Volume_1_-_Application_Programming_(24592,_r3.21,_Oct-2013).pdf
AMD64 Architecture Programmer's Manual - Volume 2 - System Programming (24593, r3.24, Oct-2013)
AMD64 Architecture Programmer's Manual - Volume 2 - System Programming (24593, r3.25, Jun-2015)
AMD64 Architecture Programmer's Manual - Volume 3 - General-Purpose and System Instructions (24594, r3.21, Oct-2013)
/tpn/AMD64_Architecture_Programmer's_Manual_-_Volume_3_-_General-Purpose_and_System_Instructions_(24594,_r3.21,_Oct-2013).pdf
opher.petergarner.net
AMD64 Architecture Programmer's Manual - Volume 3 - General-Purpose and System Instructions (24594, r3.22, Jun-2015)
/tpn/AMD64_Architecture_Programmer's_Manual_-_Volume_3_-_General-Purpose_and_System_Instructions_(24594,_r3.22,_Jun-2015).pdf
opher.petergarner.net
AMD64 Architecture Programmer's Manual - Volume 3 - General-Purpose and System Instructions (24594, r3.25, Dec-2017)
/tpn/AMD64_Architecture_Programmer's_Manual_-_Volume_3_-_General-Purpose_and_System_Instructions_(24594,_r3.25,_Dec-2017).pdf
opher.petergarner.net
AMD64 Architecture Programmer's Manual - Volume 4 - 128-Bit and 256-Bit Media Instructions (26568, r3.18, Oct-2013)
AMD64 Architecture Programmer's Manual - Volume 4 - 128-Bit and 256-Bit Media Instructions (26568, r3.19, Jun-2015)
AMD64 Architecture Programmer's Manual - Volume 5 - 64-Bit Media and x87 Floating-point Instructions (26569, r3.12, Mar-2012)
2,_Mar-2012).pdf
AMD64 Architecture Programmer's Manual - Volume 5 - 64-Bit Media and x87 Floating-point Instructions (26569, r3.13, May-2013)
3,_May-2013).pdf
AMD - AMD64 Archictecture Programmer's Manual - Volume 4 - 128-bit and 256-bit Media Instructions - Rev 3.23 - Feb 2019 (26568
AMD - AMD64 Architecture Programmer's Manual - Volume 1 - Application Programming - Rev 3.22 - Dec 2017 (24592)
AMD - AMD64 Programmer's Manual - Volume 2 - System Programming - Rev 3.30 - Sept 2018 (24593)
AMD - AMD64 Programmer's Manual - Volume 3 - General Purpose and System Instructions - Rev 3.26 - May 2018 (24594)
AMD - BIOS and Kernel Developer's Guide (BKDG) for AMD Family 15h Models 70h-7Fh Processors - Rev 3.09 - June 20th, 2018 (5507
AMD - CPUID
AMD - GCN3 Instruction Set Architecture - Graphics Core Next Architecture, Generation 3 (Revision 1.0, March 2015)
AMD - Preliminary Processor Programming Reference (PPR) for AMD Family 17h Models 00h-0Fh Processors - Rev 1.14 - April 15th, 
_-_Rev_1.14_-_April_15th,_2017_(54945).pdf
AMD - Software Optimization Guide for AMD Family 15h Processors - Rev 3.08 - Jan 2014 (47414_15h_sw_opt_guide)
arner.net
AMD - System Programming (24593)
A Method for the Construction of Minimum-Redundancy Codes - Huffman (1952)
mum-Redundancy_Codes_-_Huffman_(1952).pdf
Analysing the Performance of GPU Hash Tables for State Space Exploration - 2017 (1712.09494)
Analysis of B-tree Data Structure and its Usage in Computer Forensics (484192.B-tree)
Analysis of GS protections in Microsoft Windows Vistal - Symantec
Analyzing Contextual Bias of Program Execution on Modern CPUs (Lars Kirkholt Melhus, NTNU, June 2013)
Analyzing General Purpose Computing Performance on GPU - Thesis (2015)
Analyzing GPGPU Pipeline Latency - Poster - 2014 (poster_andresch_acaces2014)
Analyzing Runtime and Size Complexity of Integer Programs - Microsoft Research (2016)
Analyzing your game performance using Event Tracing for Windows
ing_for_Windows.pdf
A Nanopass Framework for Compiler Education
An Approach for Minimal Perfect Hash Functions for Very Large Databases (tr06)
Anatomy of High-Performance Matrix Multiplication - 2008 (gotoPaper)
cation_-_2008_(gotoPaper).pdf
An Elegant Algorithm for the Construction of Suffix Arrays (2014)
An Evaluation of Network Stack Parallelization Strategies in Modern Operating Systems
A New Basis for Shifters in General-Purpose Processors for Existing and Advanced Bit Manipulations - 2009 (IEEE_TC09_NewBasisF
An Experimental Exploration of Marsaglia's Xorshift Generators, Scrambled - 13 Oct 2016 (1402.6246)
An In-Depth Analysis of Disassembly on Full-Scale x86-x64 Binaries - 2016 (sec16_paper_andriesse)
An Informal Analysis of Perfect Hash Function Search (1989)
_(1989).pdf
An Introduction to Computational Networks and the Computational Network Toolkit - Microsoft (CNTKBook-20160121)
An Introduction To Statistical Learning with Applications in R (ISLR Seventh Printing)
tical_Learning_with_Applications_in_R_(ISLR_Seventh_Printing).pdf
An Introduction To Statistical Learning with Applications in R (ISLR Sixth Printing)
cal_Learning_with_Applications_in_R_(ISLR_Sixth_Printing).pdf
An NUMA API for Linux - Andi Kleen, Aug 2004
An Optimal Algorithm for Generating Minimal Perfect Hash Functions - 1992 (10.1.1.51.5566)
A Novel Hybrid Quicksort Algorithm Vectorized using AVX-512 on Intel Skylake - 2017 (Paper_44-A_Novel_Hybrid_Quicksort_Algorit
m_Vectorized)
An Overview of Linux Kernel Locking Improvements (August 2014)
Answering Reachability Queries on Large Directed Graphs - INF-SCR-10-10 (September, 2010)
Anti-Debugging Reference - Peter Ferrie (4 May 2011)
A NUMA API for Linux - Novell (2005)
A Parallel Page Cache- IOPS and Caching for Multicore Systems
ore_Systems.pdf
A PlusCal User's Manual - C-Syntax Version 1.8 (31 Aug 2018)
Applications of Finite Automata Representing Large Vocabularies - 1993 (10.1.1.56.5272)
Applications of Finite Geometry in Coding Theory and Cryptography
Applying the Proactor Pattern to High-Performance Web Servers
Approximate Hypergraph Partitioning and Applications (2007)
_(2007).pdf
A Practical Guide to Support Vector Classification
A Practical Minimal Perfect Hashing Method (2005)
A Primer on Memory Consistency and Cache Coherence (10.1.1.225.9278)
A Probabilistic Theory of Deep Learning (1504.00641v1)
f
A Proposal for Hardware Assisted Arithmetic Overflow Detection - 2010 - Slides (Mihocka-Troeger-CGO-WISH-2010_final)
/tpn/A_Proposal_for_Hardware_Assisted_Arithmetic_Overflow_Detection_-_2010_-_Slides_(Mihocka-Troeger-CGO-WISH-2010_final).pdf
opher.petergarner.net
A Proposal for Hardware Assisted Arithmetic Overflow Detection for Array and Bitfield Operations (LazyOverflowDetect_Final)
t_Final).pdf
A Quick Guide To LaTeX
Architectural Support for SWAR Text Processing with Parallel Bit Streams - The Inductive Doubling Principle - 2009 (p337-camer
Architecture of a Database System - 2007 (fntdb07-architecture)
7-architecture).pdf
A Relational Model of Data for Large Shared Data Banks - E.F. Codd (1970)
A Reliable Randomized Algorithm for the Closest-Pair Problem - 1997 (CP-11.4.1997)
ARIES - A Transaction Recovery Method Supporting Fine-Granularity Locking and Partial Rollbacks Using Write-Ahead Logging (199
ead_Logging_(1992).pdf
ARM - Instruction Set Quick Reference Card (QRC0001_UAL.)pdf
_UAL.)pdf.pdf
Array Layouts for Comparison-based Searching (March 14, 2017)
h_14,_2017).pdf
Array Layouts for Comparison-based Searching (September, 2015)
Array programming with NumPy - Nature - 2020 (s41586-020-2649-2)
41586-020-2649-2).pdf
Art Of Intel x86 Assembly
A Scalable and Explicit Event Delivery Mechanism for UNIX
A Scalable Concurrent malloc Implementation for FreeBSD (jemalloc)
A Scalable Lock-free Stack Algorithm (2004)
A Sense of Self for Unix Processes - 1996 (ieee-sp-96-unix)
6-unix).pdf
A Seven-Dimensional Analysis of Hashing Methods and its Implications on Query Processing - 2015 (p249-richter)
arner.net
Asim - A Performance Model Framework (2002.02.computer.asim)
ASLR on the Line - Practical Cache Attacks on the MMU - 2017 (anc_ndss17)
Aspects Related to Data Access and Transfer in CUDA - Slides - 2014 (TR-2014-09)
Assembly Language for Beginners (AL4B-EN)
0
Assessing the Relationship between Software Assertions and Code Quality - An Empirical Investigation (tr-2006-54)
Assessment of Windows Vista Kernel-Mode Security - Matthew Conover (Symantec)
A study of code abstraction (Patrick Lambert - Oct 15th, 2014)
t_15th,_2014).pdf
A Study of Wheat and Chaff in Source Code (1502.01410v1)
).pdf
A Survey of Rollback-Recovery Protocols in Message-Passing Systems (10.1.1.52.4299)
Asynchronous Teams - Cooperation Schemes for Autonomous Agents
A Systematic Evaluation of Transient Execution Attacks and Defenses - 15th May 2019 (1811.05441)
ATOM - A System for Building Customized Program Analysis Tools - 1994
A Tool for the Symbolic Execution of Linux Binaries - PySymemu (Slides)
A Truly Concurrent Semantics for the K Framework Based on Graph Transformations - Slides (serbanuta-rosu-2012-icgt-slides)
lides).pdf
Attacking the Windows Kernel - 2007
A Tunable Compression Framework for Bitmap Indices (Guzun_ICDE_2014)
A Tutorial on Bayesian Optimization of Expensive Cost Functions, with Application to Active User Modeling and Hierarchical Rei
Automated Instruction Stream Throughput Prediction for Intel and AMD Microarchitectures - 2018 (1809.00912)
Automatically Proving Termination and Memory Safety for Programs with Pointer Arithmetic - Microsoft Research (2016)
/tpn/Automatically_Proving_Termination_and_Memory_Safety_for_Programs_with_Pointer_Arithmetic_-_Microsoft_Research_(2016).pdf
opher.petergarner.net
Automatic Self-Allocating Threads on an SGI Challenge (10.1.1.37.3403)
AutoML - Chapter 01 - Hyperparameter Optimization (2018)
).pdf
A Versatile Graph Structure for Edge-Oriented Graph Algorithms - 1987 (Ebert1987AVD)
A Very Fast Substring Search Algorithm - 1999 (p132-sunday)
Avoiding AVX to SSE Transition Penalties
A Wavelet Tree Based FM-Index for Biological Sequences in SeqAn (January 30, 2012)
A Way Forward in Parallelising Dynamic Languages (PyPy Position Paper)
Background, Motivation, and a Retrospective View of the BLAS (Lawson_BLAS)
Backward Search FM-Index (Full-text Index in a Minute Space) - Slides
Balanced Families of Perfect Hash Functions and Their Applications - 2007
tions_and_Their_Applications_-_2007.pdf
Bash Redirections - Cheat Sheet
Basic Linear Algebra Subprograms for Fortran Usage - BLAS (1979)
age_-_BLAS_(1979).pdf
Basics of Compiler Design - Anniversary Edition
Battle of SKM and IUM - How Windows 10 Rewrites OS Architecture - Alex Ionescu - 2015 (blackhat2015)
Bayesian Data Analysis - Third Edition (13th Feb 2020)
f
Bayesian Reasoning and Machine Learning (181115)
Benchmarking a B-tree Compression Method
Benefits of IO Acceleration Technology in Clusters
Best Practices for Gathering Optimizer Statistics for Oracle 12c (June 2013)
zer_Statistics_for_Oracle_12c_(June_2013).pdf
Best Practices for Vectorization - Getting Ready for Intel AVX-512 (2015)
Better Bitmap Performance with Roaring Bitmaps (2014)
Better Performance at Lower Occupancy - Slides - 2010 (volkov10-GTC)
des_-_2010_(volkov10-GTC).pdf
Better with Fewer Bits - Improving the Performance of Cardinality Estimation of Large Data Streams (INFOCOM2017)
Beyond Block IO - Rethinking Traditional Storage Primitives (ouyangx-hpca2011)
itional_Storage_Primitives_(ouyangx-hpca2011).pdf
Beyond Block IO - Rethinking Traditional Storage Primitives (ouyangx-hpca2011-slides)
ng_Traditional_Storage_Primitives_(ouyangx-hpca2011-slides).pdf
BGP in 2013 (and a bit of 2014) - Slides (156-2014-05-12-bgp2013)
Big Data - New Tricks for Econometrics
BigQuery Technical Whitepaper - Google
Binarized Neural Networks - Training Deep Neural Networks with Weights and Activations Constrained to +1 or -1 - 2016 (1602.02
30v3)
Binarized Neural Networks- Training Deep Neural Networks with Weights and Activations Constrained to +1 or -1 - 2016 (1602.028
Binary Coding (2017)
Binary Combinatorial Coding (2003)
Binary Search Tree with SIMD Bandwidth Optimizations Using SSE (Preso06-SIMDTree)
BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors - r3.30 Feb 2006
Bitcoin - A Peer-to-Peer Electronic Cash System
Bitmap Graphics and Bitblit - Course Notes - SIGGRAPH 1984 (pike84bitblt)
Bitmap Graphs SIGGRAPH84 Course Notes (pike84bitblt)
Bitmap Index Design and Evaluation - 1998 (P355)
Bitmap Index Design Choices and Their Performance Implications (LBNL-62756)
r_Performance_Implications_(LBNL-62756).pdf
Bitmap Indexing and Related Techniques - Slides
Bitmap Indices for Data Warehouses
Bit Operations (Ray Seyfarth 2011)
BitPath - Label Order Constrained Reachability Queries over Large Graphs - 1203.2886 (13th March, 2012)
Blackout - What Really Happened - Slides (2007)
Blade - A Data Center Garbage Collector - 2015 (1504.02578)
BLAKE2 - Simpler, Smaller, Fast as MD5 (2013-01-29)
er.petergarner.net
Blogel - A Block-Centric Framework for Distributed Computation on Real-World Graphs (2014)
Boosting Vector Calculus with the Graphical Notation - 3 Nov 2019 (1911.00892)
Bounds Checking on the GPU - Futhark (hlpp20)
BPF - In-memory Virtual Machine (bpf_collabsummit_2015feb20)
Branch and Data Herding - Reducing Control and Memory Divergence for Error-tolerant GPU Applications (tmm12_preprint)
h/tpn/Branch_and_Data_Herding_-_Reducing_Control_and_Memory_Divergence_for_Error-tolerant_GPU_Applications_(tmm12_preprint).pd
Branch Prediction and the Performance of Interpreters - Don't Trust the Folklore - 2013 (RR-8405)
Branch Prediction with Neural Networks - Hidden layers and Recurrent Connections
Brief Calculus - Benjamin Crowell  - Nov 10th, 2015
er.petergarner.net
Bringing SIMD-128 to JavaScript (TC-39)
Broadword Implementation of Parenthesis Queries
Broadword Implementation of Rank-Select Queries (Nov 19, 2014)
Brook for GPUs - Stream Computing on Graphics Hardware - Paper
Brook for GPUs - Stream Computing on Graphics Hardware - Slides (2004)
B-trees, Shadowing, and Clones (2007)
Bugs as Deviant Behavior - A General Approach to Inferring Errors in Systems Code - ACM - 2001 (deviant-sosp-01)
Building a Bw-Tree Takes More Than Just Buzz Words - 2018 (mod342-wangA)
Building R Packages - An Introduction
Build Systems a la Carte - 2018 (build-systems-5ab0f42d0f937)
Bumper Sticker Computer Science
Burrows-Wheeler Transform and FM Index - Slides (Ben Langmead, Johns Hopkins)
ndex_-_Slides_(Ben_Langmead,_Johns_Hopkins).pdf
Bypass Control Flow Guard Comprehensively - Slides (2015)
15).pdf
C++14 - Working Draft (N3797)
C++17 Language Features Reference Card (2019)
C++20 Reference Card - 29th Jan 2020
Cache and IO Efficient Algorithms
Cache Aware Bi-tier Task-stealing in Multi-socket Multi-core Architecture (icpp11)
Cache-Aware Lock-Free Queues for Multiple Producers-Consumers and Weak Memory Consistency 1
Cache-Aware Lock-Free Queues for Multiple Producers-Consumers and Weak Memory Consistency
Cache, Hash and Space-Efficient Bloom Filters (10.1.1.93.7688)
.1.1.93.7688).pdf
Cache, Hash and Space-Efficient Bloom Filters
Cache-Oblivious Algorithms and Data Structures (Demaine, 2002)
Cache-Oblivious Peeling of Random Hypergraphs - 2nd Dec 2013 (1312.0526)
Cache-Oblivious Streaming B-trees
Cache Organization and Memory Management of the Intel Nehalem Computer Architecture
CAF - The C++ Actor Framework for Scalable and Resource-efficient Applications - ACM 2014 (ageresplash2014_submission_5)
Calculus Made Easy
Calculus Refresher, Version 2008.4 (Paul Garrett)
Canopy - An End-to-End Performance Tracing and Analysis System - 2017 (sosp17-final14)
Can't Get To Performing Without Storming (pat-ma03)
er.petergarner.net
Captain Hook - Pirating AVs to Bypass Exploit Mitigations - Slides (2016)
CASEVision - ClearCase Administration Guide (007-1774-020)
C Cheat Sheet (ashlyn-black_c-reference)
Checking System Rules Using System-Specific, Programmer-Written Compiler Extensions (mc-osdi)
Chihuahua - A Concurrent, Moving, Garbage Collector using Transactional Memory - 2015 (anderson-transact-2015)
arner.net
Chinese Remainder Theorem and its Applications
Choosing a Good Chart (A. Abela, 2006)
Chord - A Scalable Peer-to-peer Lookup Service for Internet Applications (2001)
CityHash - Fast Hash Functions for Strings - Slides (121017-slides)
CK-12 Probability and Statistics Advanced - Second Edition
ition.pdf
ClearCase Administrator's Guide (7165_2167_cc_proj.admin)
Cluster-based Mixed Coding Schemes for Inverted File Index Compression (v6i10a4)
Codes for Positive Integers - CS423, Lecture 6, McGill (2008)
Gill_(2008).pdf
Cognitive Biases Potentially Affecting Judgment of Global Risks (2008)
Colfax Optimization Techniques for the Intel MIC Architecture - Part 1 of 3 - Multi-threading and Parallel Reduction (2015)
Colfax Optimization Techniques for the Intel MIC Architecture - Part 2 of 3 - Strip-Mining for Vectorization (2015)
Colfax Optimization Techniques for the Intel MIC Architecture - Part 3 of 3 - False Sharing and Padding (2015)
arner.net
Colfax - Programming and Optimization for Intel Architecture (2016)
Comdb2 - Bloomberg's Highly Available Relational Database System - 2017 (p1377-scotti)
ly_Available_Relational_Database_System_-_2017_(p1377-scotti).pdf
Communication Efficient Distributed Machine Learning with the Parameter Server
Comparative Performance of Memory Reclamation Strategies for Lock-Free and Concurrently-Readable Data Structures
Competitive Programmer's Handbook - Antti Laaksonen - (10th December, 2017)
Compiler Calling Conventions
Compiler Confidential - Eric Brumer (6th Sept 2013)
er.petergarner.net
Compiler Construction - Niklaus Wirth - 1996 (CBEAll)
Compiler Construction - Niklaus Wirth - 2005 (CBEAll)
Compiler Construction - The Art of Niklaus Wirth (2000)
Compiler Design In C
Compiler Design - Theory, Tools and Examples
Compiler Internals - Exceptions and RTTI - Igor Skorchinsky (Hex-Rays) - Recon 2012
ons_and_RTTI_-_Igor_Skorchinsky_(Hex-Rays)_-_Recon_2012.pdf
Compiling Python Modules to Native Parallel Modules Using Pythran and OpenMP Annotations
Component Object Model - An Overview and Practical Implementation (IJSARTV3I38438636248891114924768)
Compressed Bloom Filters
Compressed Inverted Indexes - Slides (2010)
Compressed Perfect Embedded Skip Lists for Quick Inverted-Index Lookups
Compression - Slides
Computer Systems Research
Concurrent Hash Tables - Fast and General - 2016 (1601.04017v2)
Concurrent Hash Tables - Fast and General - ACM - 2019 (3309206)
_-_2019_(3309206).pdf
Concurrent Programming for Scalable Web Architectures - Benjamin Erb - Thesis (April 2012) (vts_8082_11772)
urrent_Programming_for_Scalable_Web_Architectures_-_Benjamin_Erb_-_Thesis_(April_2012)_(vts_8082_11772).pdf
Concurrent Reference Counting and Resource Management in Constant Time - 29 Feb 2020 (2002.07053)
Conflict-Free Vectorization of Associative Irregular Applications with Recent SIMD Architectural Advances - Feb 2018 (cgo18)
18_(cgo18).pdf
Consistently Faster and Smaller Compressed Bitmaps with Roaring - 19th April, 2016 (1603.06549)
ter_and_Smaller_Compressed_Bitmaps_with_Roaring_-_19th_April,_2016_(1603.06549).pdf
Constraint Propagation Algorithms for Temporal Reasoning - A Revised Report (vilain-kautz-book)
Convex Optimization (2009)
Convex Optimization - Slides
Cooperative Kernels - GPU Multitasking for Blocking Algorithms (fse2017)
Coq - The World's Best Macro Assembler
Cores of Random r-Partite Hypergraphs - Dec 15 2010 (tr001_10)
10_(tr001_10).pdf
CORFU - A Shared Log Design for Flash Clusters
COZ - Finding Code that Counts with Causal Profiling - 2015 (090-curtsinger)
_Causal_Profiling_-_2015_(090-curtsinger).pdf
COZ - Finding Code that Counts with Causal Profiling - 2015 (UM-CS-2015-008)
_Causal_Profiling_-_2015_(UM-CS-2015-008).pdf
COZ - Finding Code that Counts with Causal Profiling - Slides (2015)
CPU Caches - Slides (2017)
Creating R Packages - A Tutorial (Sept 14 2009)
Critique of Microkernel Architectures (Slides)
CS195V Brown - Week 10 - CUDA Part 1 - Slides
CS195V Brown - Week 11 - CUDA Part 2 - Slides
CS195V Brown - Week 1 - Advanced GPU Programming (Intro)
CS195V Brown - Week 2 - Modern OpenGL - Slides
CS195V Brown - Week 3 - GLSL Programming - Slides
CS195V Brown - Week 4 - Noise Functions - Slides
CS195V Brown - Week 6 - Image Samplers and Atomic Operations - Slides
_Atomic_Operations_-_Slides.pdf
CS195V Brown - Week 7 - Fluids - Slides
CS195V Brown - Week 8 - Materials and BRDFs - Slides
CS195V Brown - Week 9 - GPU Architecture and Other Shading Languages - Slides
C++ Standard - 2012-01-16 - Working Draft (N3337)
Cuckoo Filter - Practically Better Than Bloom
Cuckoo++ Hash Tables - High-Performance Hash Tables for Networking Applications - 2017 (1712.09624)
h_Tables_-_High-Performance_Hash_Tables_for_Networking_Applications_-_2017_(1712.09624).pdf
CUDA Asynchronous Memory Usage and Execution (cuda_05_ykhung)
CUDA C and C++ Streams and Concurrency - NVIDIA - Slides
CUDA C Programming Guide v8.0 - Design Guide - September, 2016 (PG-02829-001_v8.0)
_-_Design_Guide_-_September,_2016_(PG-02829-001_v8.0).pdf
CUDA Debugging with Command Line Tools - 2014 (S4578)
CUDA Managed Memory - Slides (2020)
CUDA Optimizations - Slides (April 2016)
CUDA_practice
CUDA - Quick Reference
CUDAsmith - A Fuzzer for CUDA Compilers (TR-2020-05)
CUDA Streams - Best Practices and Common Pitfalls - Slides (2012)
CUDA Thread Basics - Slides (2011)
CUDA Thread-Indexing Cheatsheet
CUDA Threads - GPU Architecture and Programming - NYU CSCI-GA.3033-012 (2012)
CUDA Unified Memory - GPGPU - Slides (2015)
Curves and Surfaces - Lecture Notes for Geometry 1 - Henrik Schlichtkrull - University of Copenhagen (2011)
Dapper - A Large-Scale Distributed Systems Tracing Infrastructure (36356)
tems_Tracing_Infrastructure_(36356).pdf
Database Fundamentals
Database System Implementation - COSC 404 - Slides
Data Compression Techniques - Lecture 1 - Shannon's Theorem - University of Helsinky - Slides (2015)
Data Compression Techniques - Lecture 2 - Morse Code to Huffman Coding - University of Helsinky - Slides (2015)
Data Compression Techniques - Lecture 3 - Integer Codes 1 - University of Helsinky - Slides (DCT2015-Lecture3Web)
Data Compression Techniques - Lecture 4 - Integer Codes 2 - University of Helsinky - Slides (DCT2015-Lecture4)
arner.net
Data Compression Techniques - Lecture 5 - Adaptive Prefix-Free Coding - University of Helsinky - Slides (2015)
arner.net
Data Compression Techniques - Lecture 6 - Arithmetic Coding (2015)
thmetic_Coding_(2015).pdf
Data Compression Techniques - Lecture 7 - Dictionary Compression (DCT2015-Lecture7Web)
DataMining-ch1
DataMining-ch2
DataMining-ch3
DataMining-ch4
DataMining-ch5
DataMining-ch6
DataMining-ch7
Data-Parallel Hashing Techniques for GPU Architectures - 11 Jul 2018 (1807.04345)
Data Structures and Algorithms (2008)
Data Structures for Text Sequences
Data Transfer Matters for GPU Computing - 2013 (icpads13)
13).pdf
Debugging Programs that use Atomic Blocks and Transactional Memory (2010)
Debugging Tools for Windows (b7f35e165e8b2083ad68d4dbd398b7ba)
d4dbd398b7ba).pdf
Debugging Tools for Windows (WinDbg, KD, CDB, NTSD)
er.petergarner.net
Debunking the 100x GPU vs CPU Myth - An Evaluation of Throughput Computing on CPU and GPU
DEC - The Mistakes That Led To Its Downfall (Goodwin Paper)
DEC - The Mistakes that led to its Downfall
Deep Learning Tutorial - Slides - 2013 (lecun-ranzato-icml2013)
DeepState - Symbolic Unit Testing for C and C++ - 2018 (bar18)
Demystifying DAS, SAN, NAS, NAS Gateways, Fibre Channel, and iSCSI
Demystifying GPU Microarchitecture through Microbenchmarking - 2010 (gpuarch-ispass2010)
Deny Capabilities for Safe, Fast Actors - Ponylang (2015)
15).pdf
Depth-First Search and Linear Graph Algorithms - Tarjan (1972)
Derivability, Consistency (rj599)
Derivability, Redundancy and Consistency of Relations Stored in Large Data Banks - E. F. Codd (1969)
Designing COM Interfaces - 1995
Deterministic Dynamic Deadlock Detection and Recovery
Detours - Binary Interception of Win32 Functions - 1999 (huntusenixnt99)
Developing and Porting Applications to AIX (sg245674)
Digital FX32 - Running 32-bit x86 Applications on Alpha NT
Dijkstra's in Disguise - Eric Jang (12th August, 2018)
f
DI-MMAP - A High Performance Memory Map Runtime for Data-Intensive Applications (Nov 16 2012) - Deck
DI-MMAP - A High Performance Memory Map Runtime for Data-Intensive Applications (Nov 16 2012) - Paper
Direct Cache Access for High Bandwidth Network IO - 2005 (huggahalli05)
Disk Based Hash Tables and Quantified Numbers (24th March, 2014)
Disruptor - High performance alternative to bounded queues for exchanging data between concurrent threads (May 2011)
/tpn/Disruptor_-_High_performance_alternative_to_bounded_queues_for_exchanging_data_between_concurrent_threads_(May_2011).pdf
opher.petergarner.net
Dissecting the NVIDIA Turing T4 GPU via Microbenchmarking - 18 Mar 2019 (1903.07486)
Dissecting the NVIDIA Volta GPU Architecture via Microbenchmarking - 2018 (1804.06826)
Dissecting the NVIDIA Volta GPU Architecture via Microbenchmarking - 2018 - Slides (1804.06826)
Distributed and Parallel Time Series Feature Extraction for Industrial Big Data Applications - 25th October 2016 (1610.07717v1
6_(1610.07717v1).pdf
Distributed Component Object Model (DCOM) Remote Protocol - MS-DCOM-2015 (October 16th, 2015)
Dodd-Frank Act Stress Test 2014 - Supervisory Stress Test Methodology and Results - March 2014 (bcreg20140320a1)
Down For The Count - Getting Reference Counting Back in the Ring (rc-ismm-2012)
Draw Me A Local Kernel Debuger - Slides (2015)
Dropout - A Simple Way to Prevent Neural Networks from Overfitting - 2014 (JMLRdropout)
DTrace Dynamic Tracing In Oracle Solaris, Mac OS X & FreeBSD
Dueling UNIXes and the UNIX Wars (login_apr15_17_salus).pdf
Dynamic Storage Allocation - A Survey and Critical Review
Dynamic Storage Allocation - Survey and Critical Review
Effective Computation of Biased Quantiles over Data Streams (bquant)
Efficient Algorithms for Large-Scale Image Analysis (978-3-86644-786-8_PDFA)
Efficient Computation of Binomial Coefficients Using Splay Trees - 2016 (10.11648.j.ijdst.20160201.14)
Efficient Estimation of Mutual Information for Strongly Dependent Variables (gao15)
Efficient Estimation of Word Representations in Vector Space - 2013 (1301.3781)
Efficient Estimation of Word Representations in Vector Space - 7th Sep 2013 (1301.3781)
Efficient Exploitation of Parallelism on Pentium III and Pentium 4 Processor-Based Systems - 2001 (art_6)
ent_Exploitation_of_Parallelism_on_Pentium_III_and_Pentium_4_Processor-Based_Systems_-_2001_(art_6).pdf
Efficient Hashing with Lookups in two Memory Accesses - 2018 (0407023v1)
emory_Accesses_-_2018_(0407023v1).pdf
Efficient Hash Probes on Modern Processors (icde2007)
Efficient Implementation of Lazy Suffix Trees (gie-kur-sto-2003)
Efficient Implementation of Reductions on GPU Architectures (2017)
Efficient Implementation of Sorting on Multicore SIMD CPU Architecture - Slides - VLDB 2008 (9-29-15)
Efficient Implementation of Sorting on Multicore SIMD CPU Architecture - VLDB 2008 (1454171)
Efficient Lightweight Compression Algorithm Alongside Fast Scans (damon15)
orithm_Alongside_Fast_Scans_(damon15).pdf
Efficient Lossless Compression of Trees and Graphs
Efficiently Compiling Efficient Query Plans for Modern Hardware - 2011 (p539-neumann)
cient_Query_Plans_for_Modern_Hardware_-_2011_(p539-neumann).pdf
Efficient Parallel Graph Exploration on Multi-Core CPU and GPU - 2011 (pact11-hong)
Efficient String Matching - An Aid to Bibliographic Search - Aho-Corasick (1975)
Efficient Virtual Memory for Big Memory Servers (isca13_direct_segment)
Egocentrism Over E-Mail - Can We Communicate as Well as We Think (krugeretal05)
EIT - The Internal Extent Formula for Compacted Tries
Elementary Calculus - An Infinitesimal Approach (keislercalc-03-07-17)
Elevated - Function 2009
ELF Format
ELF Handling for Thread-Local Storage - Ulrich Drepper (2005)
Eliminating Global Interpreter Locks in Ruby through Hardware Transactional Memory (PPoPP2014_RubyGILHTM)
Empirical Study of the Anatomy of Modern SAT Solvers (2010)
_(2010).pdf
Encyclopedia of Controller Fundamentals and Features - Firmware Version 3.2 to 8.0 (8_0_775041-01C)
Engineering Better Software at Microsoft - Jason Yang, Slides - 30th Nov 2011 (25-sal)
Enhancing Server Availability and Security Through Failure-Oblivious Computing - 2004 (rinard)
ESET - A Machine-Learning Method to Explore the UEFI Landscape (Sept 2019)
Establishing a Base of Trust with Performance Counters for Enterprise Workloads - 2015 (atc15-paper-nowak)
Estimating Flight Characteristics of Anomalous Unidentified Aerial Vehicles (entropy-21-00939-v2)
ght_Characteristics_of_Anomalous_Unidentified_Aerial_Vehicles_(entropy-21-00939-v2).pdf
Estoteric Hooks - Alex Ionescu - Slides (2015)
Evaluation of Contemporary Graph Databases for Efficient Persistence of Large-Scale Models
Evaluation of Parallel Design Patterns for Message Processing Systems on Embedded Multicore Systems
Evaluation of Rolling Sphere Method Using Leader Potential Concept - A Case Study - 2006 (IT P501-124)
EventSource Activities Specification (2016)
Event Source User Guide
Everything We Know About CRC But Afraid To Forget (3rd September, 2010)
Everything You Always Wanted to Know About Synchronization but Were Afraid to Ask (p33-david)
Exact Minimum Degree Thresholds for Perfect Matchings in Uniform Hypergraphs (2012)
Experiences in the Land of Virtual Abstractions - Slides - 2014 (VEE14-present601)
rtual_Abstractions_-_Slides_-_2014_(VEE14-present601).pdf
Experiences Porting Real Time Signal Processing Pipeline CUDA Kernels to Kepler and Windows 8 - Slides - 2014 (S4148-rt-signal
Expert programmers have fine-tuned cortical representations of source code (2020.01.28.923953v1.full)
Explaining AdaBoost
eXplode- A Lightweight, General System for Finding Serious Storage System Errors (explode-osdi06)
htweight,_General_System_for_Finding_Serious_Storage_System_Errors_(explode-osdi06).pdf
Exploiting Coarse-Grain Speculative Parallelism
Exploiting Deferred Destruction - An Analysis of Read-Copy-Update Techniques in Operating System Kernels (RCUdissertation.2004
Exploiting SIMD for Complex Numerical Predicates - 2015 (HardBD16_3)
cates_-_2015_(HardBD16_3).pdf
Exploring Control Flow Guard in Windows 10 - Trend Micro
Exploring PLSQL New Features Best Practices - OOW 2013 Aharonovich
Exponential Golomb and Rice Error Correction Codes for Generalized Near-Capacity Joint Source and Channel Coding (ExpgECRiceEC
Extending Oracle E-Business Suite Release 12.1 and above using Oracle Application Express (345780)
Extending Python for High-performance Data-Parallel Programming (March 24, 2014)
External Perfect Hashing for Very Large Key Sets - 2007 (cikm07)
Extra 300 - Pilot's Operating Handbook (20th Sept, 2009)
).pdf
Faliure-Atomic msync() - A Simple and Efficient Mechanism for Preserving the Integrity of Durable Data
Fallout - Reading Kernel Writes From User Space - 29th May 2019 (1905.12701)
Fast and Scalable Minimal Perfect Hashing for Massive Key Sets - 2017 (1702.03154)
Fast and Space Efficient Trie Searches - Phil Bagwell - ACM
FastBDT - A speed-optimized and cache-friendly implementation of stochastic gradient-boosted decision trees for multivariate c
radient-boosted_decision_trees_for_multivariate_classification_-_2016_(1609.06119v1).pdf
Fast Bit Compression and Expansion with Parallel Extract and Parallel Deposit Instructions - 2006 (hilewitz06)
arner.net
Fast Bit Gather, Bit Scatter and Bit Permutation Instructions for Commodity Microprocessors - 2008 (Hilewitz_JSPS_08)
h/tpn/Fast_Bit_Gather,_Bit_Scatter_and_Bit_Permutation_Instructions_for_Commodity_Microprocessors_-_2008_(Hilewitz_JSPS_08).pd
Fast CRC Computation for Generic Polynomials Using PCLMULQDQ Instruction - Intel (December, 2009)
Fast Databases with Fast Durability and Recovery Through Multicore Parallelism (osdi14-paper-zheng_wenting)
Fast Deterministic Selection - Andrei Alexandrescu - June 2016 (1606.00484v1)
rei_Alexandrescu_-_June_2016_(1606.00484v1).pdf
Faster 64-bit Universal Hashing using Carry-less Multiplication - 2015 (1503.03465)
ing_using_Carry-less_Multiplication_-_2015_(1503.03465).pdf
Faster Base64 Encoding and Decoding Using AVX2 Instructions v4 (2018) (1704.00605)
Faster Population Counts using AVX2 Instructions (1611.07612v1)
_(1611.07612v1).pdf
Fast Exact Multiplication by the Hessian - 1993 (nc-hessian)
-hessian).pdf
FAST - Fast Architecture Sensitive Tree Search on Modern CPUs and GPUs
FAST - Fast Architecture Sensitive Tree Search on Modern CPUs and GPUs - Slides
ve_Tree_Search_on_Modern_CPUs_and_GPUs_-_Slides.pdf
Fast Keyed Hash and Pseudo-Random Function using SIMD Multiply and Permute - 20 Nov 2016 (1612.06257v2)
Fast Multiple String Matching Using Streaming SIMD Extensions Technology - 2013 (psc13p08_presentation)
Fast Packed String Matching for Short Patterns - 2012 (1209.6449)
_-_2012_(1209.6449).pdf
Fast Parallel GPU-Sorting Using a Hybrid Sort
Fast Parallel Suffix Array on the GPU
Fast Prefix Search in Little Space, with Applications
Fast Quicksort Implementation Using AVX Instructions - 2015 (10.1.1.1009.7773)
ng_AVX_Instructions_-_2015_(10.1.1.1009.7773).pdf
Fast Scalable Construction of (Minimal Perfect Hash) Functions - 22 Mar 2016, v2 (1603.04330)
truction_of_(Minimal_Perfect_Hash)_Functions_-_22_Mar_2016,_v2_(1603.04330).pdf
Fast Scalable Construction of (Minimal Perfect Hash) Functions
Fast Search in Hamming Space with Multi-Index Hashing
Fast Sorted-Set Intersection using SIMD Instructions (p1-SCHLEGEL)
Fast Sorting Algorithms using AVX-512 on Intel Knight's Landing (1704.08579)
12_on_Intel_Knight's_Landing_(1704.08579).pdf
Fast Sorting Algorithms using AVX-512 on Intel Knights Landing - 24 Apr 2017 (1704.08579)
Fast Sort on CPUs, GPUs and Intel MIC Architectures - Technical Report - Intel Labs (intel-labs-radix-sort-mic-report)
Fast Splittable Pseudorandom Number Generators (oopsla14)
Fast String Correction with Levenshtein-Automata (2002) (10.1.1.16.652)
Featherweight Threads for Communication - 2011 (parasites_tech11)
_(parasites_tech11).pdf
FERRARI - Flexible and Efficient Reachability Range Assignment for Graph Indexing
Fibers Under The Magnifying Glass - 2018 (p1364r0)
Fibre Channel Fundamentals
Fibre Channel Reference Card
Filter Manager - Windows
Finance - Salomon Smith Barney Introductory Guide to Equity Options (1998)
uctory_Guide_to_Equity_Options_(1998).pdf
Finding Frequent Items in Data Streams
Finding Frequent Items in Data Streams - PLVDB - 2008
Finding Minimal Perfect Hash Functions - 1986 (10.1.1.144.9650)
0.1.1.144.9650).pdf
Finding Similar Items
Finding Small Balanced Separators (2006)
FLASHRELATE - Extracting Relational Data from Semi-Structured Spreadsheets Using Examples (Microsoft Research - April 2014)
Flush+Reload - A High-Resolution, Low-Noise, L3 Cache Side-Channel Attack (2014)
Folding and Unfolding - Erik D. Demaine - Ph.D Thesis 2001 (eddemaine2001)
ne_-_Ph.D_Thesis_2001_(eddemaine2001).pdf
Foreign Library Interface
Foundations of Databases
Foundations of Data Science (June, 2016)
Foundations of Data Science
FPGA Acceleration by Dynamically-Loaded Hardware Libraries - 2016 (tr16_03_Nannarelli_A)
Fractal Prefetching B+ Trees - Optimizing Both Cache and Disk Performance
Framework for Instruction-level Tracing and Analysis of Program Executions (2006)
Free Launch - Optimizing GPU Dynamic Kernel Launches through Thread Reuse (2015)
From Numerical Cosmology to Efficient Bit Abstractions for the Standard Library - Vincent Reverdy - CppCon 2016
Fully Concurrent Garbage Collection of Actors on Many-Core Machines - 2013 (opsla237-clebsch)
Fundamentals of Calculs - Crowell et al - 2016
Fundamentals of COM(+) - Part 1 - Slides - Don Box
Fundamentals of Deep Learning of Representations - 2014 (Tel-Aviv-7nov2014)
Fundamentals of Learning (2015)
Further Scramblings of Marsaglia's Xorshift Generators - 23 May 2016 (1404.0390)
a's_Xorshift_Generators_-_23_May_2016_(1404.0390).pdf
Futexes Are Tricky - Ulrich Drepper (2011)
General Analysis of Maxima and Minima in Constrained Optimization Problems
General Incremental Sliding-Window Aggregation (p702-tangwongsan)
Generalized Golomb Codes and Adaptive Coding of Wavelet-Transformed Image Subbands (August 15th, 2003)
Generalized Histogram Algorithms for CUDA GPUs - Slides - 2012 (histogram_para2012)
thms_for_CUDA_GPUs_-_Slides_-_2012_(histogram_para2012).pdf
Generating Sequences With Recurrent Neural Networks (1308.0850v5)
Generating Text with Recurrent Neural Networks (LANG-RNN)
Getting Physical - Extreme Abuse of Intel-based Paging Systems - Slides - 2016 (CSW2016_Economou-Nissim_GettingPhysical)
Getting Started with CUDA (2008)
Getting Started with Software Tracing in Windows Drivers (WinHEC 2005 - April 18, 2005)
Git from the Bottom Up
Git Magic
Go 1.5 Concurrent Garbage Collector Pacing
Goals Gone Wild - The Systematic Side Effects of Over-Prescribing Goal Setting - Harvard Business School (09-083)
Google's Neural Machine Translation System - Bridging the Gap between Human and Machine Translation - 2016 (1609.08144v1)
GPERF - A Perfect Hash Function Generator
0
GPU-ArraySort - A parallel, in-place algorithm for sorting large number of arrays (2016)
GPU Control Flow and Synchronization - Slides
GPU Optimization Fundamentals
GPU Programming Basics - Slides
GPU Random Numbers via the Tiny Encryption Algorithm (2010)
Grand Central Dispatch - FreeBSD Dev Summit (18 Sep 2009)
09).pdf
GraphBLAS Mathmatics - Provisional Release 1.0 - Jeremy Kepner (26th April, 2017)
onal_Release_1.0_-_Jeremy_Kepner_(26th_April,_2017).pdf
Graphs, Hypergraphs and Hashing (1994)
Graph Theoretic Obstacles to Perfect Hashing - 1994 (TR0257)
Graph Theory (2005)
GRIM - Leveraging GPUs for Kernel Integrity Monitoring
f
GTC 2017 - Parallel Depth First on GPU - Slides (s7469-maxim-naumov-parallel-depth-first-on-gpu)
Guide to Automatic Vectorization with Intel AVX-512 Instructions in Knights Landing Processors - Bonan Zhang - Colfax Internat
onal, 2016 (Colfax_KNL_AVX512_Guide)
_Landing_Processors_-_Bonan_Zhang_-_Colfax_International,_2016_(Colfax_KNL_AVX512_Guide).pdf
Gunrock - A Fast and Programmable Multi-GPU Graph Processing Library - Slides - 2015 (SC5139)
Gunrock - A Fast and Programmable Multi-GPU Graph Processing Library - Slides - 2016 (S6374)
Gunrock - A High-Performance Graph Processing Library on the GPU - 2016
H2O - The Opytimized HTTP Server (Kazuho Oku, 2014)
er.petergarner.net
Hardware Acceleration for Memory-to-Memory Copies - January 13, 2017 (EECS-2017-2)
Hardware-Aware Optimization- Using Intel Streaming SIMD Extensions - Slides (2010)
Hardware Breakpoint (or watchpoint) usage in Linux Kernel (ols2009-pages-149-158)
Hardware is the new software (baumann-hotos17)
Hardware Transactional Memory on Haswell
HARE - Hardware Acceleration for Regular Expressions - 2016 (micro16)
Harnessing Intel Processor Trace on Windows for Vulnerability Discovery - D1T1 - Richard Johnson - Slides (2017)
Hash and Displace - Efficient Evaluation of Minimum Perfect Hash Functions - 1999 (10.1.1.148.7694)
place_-_Efficient_Evaluation_of_Minimum_Perfect_Hash_Functions_-_1999_(10.1.1.148.7694).pdf
Hashcash - A Denial of Service Counter-Measure (1st August, 2002)
Hash, Displace, and Compress (esa09)
Hash Functions for GPU Rendering - 2020 (Jarzynski2020Hash)
20Hash).pdf
HASHI - An Application-Specific Instruction Set Extension for Hashing - 2014 (adms14_arnold)
Hash Tables - Jeff Erickson (2014)
Haskell vs. F sharp vs. Scala - A High-Level Language Features and Parallelism Support Comparison (fhpc12)
Haswell Block Diagram
HAT-trie - A Cache-conscious Trie-based Data Structure for Strings - 2007 (CRPITV62Askitis)
onscious_Trie-based_Data_Structure_for_Strings_-_2007_(CRPITV62Askitis).pdf
HDF5 - Taming Parallel IO Complexity with Auto-Tuning (P4091-0713_2)
Heapy - A Memory Profiler and Debugger for Python - 2006 (heapy-thesis)
HELIX-RC - An Architecture-Compiler Co-Design for Automatic Parallelization of Irregular Programs (campanoni14-isca)
/tpn/HELIX-RC_-_An_Architecture-Compiler_Co-Design_for_Automatic_Parallelization_of_Irregular_Programs_(campanoni14-isca).pdf
opher.petergarner.net
Heracles- Improving Resource Efficiency at Scale (2015.heracles.isca)
Heracles - Improving Resource Efficiency at Scale (2015)
).pdf
HexRaysCodeXplorer - Making Object-Oriented RE Easier - Slides (2013)
HexRaysCodeXplorer - Making Object-Oriented RE Easier - Slides (2014)
Hidden Markov Model
High-performance Concurrency Control Mechanisms for Main-memory Databases (p298_per-akelarson_vldb2012)
High Performance Histograms on SIMT and SIMD Architectures - M.E.R. Berger, Master's Thesis (2015)
High Performance IO with NUMA Systems in Linux
High Speed Hashing for Integers and Strings - 2020 (1504.06804)
20_(1504.06804).pdf
High Throughput Heavy Hitter Aggregation for Modern SIMD Processors (damon13)
Histograms - CUDA Handbook - Slides (2015)
Hoard - A Scalable Memory Allocator for Multithreaded Applications (berger-asplos2000)
How Does a GPU Shader Work (2018)
How fast can we make interpreted Python - NYU (2012)
How Microsoft Builds Software (1997)
How Not To Measure Latency - Gil Tene - LL Summit NYC (12-Nov-2013)
How the VAX Lost Its POLY (and EMOD and ACB_floating too) (vax_poly)
How to Benchmark Code Execution Times on Intel IA-32 and IA-64 Instruction Set Architectures - September, 2010 (324264-001)
How To Code In HTML5 And CSS3 - Damian Wielgosik
How TokuDB Fractal Tree Databases Work Presentation
er.petergarner.net
How To Overcome the GIL Limitations (While Staying In Python Ecosphere) - Francesc Alted (2011)
How to Partition a Billion-Node Graph - Microsoft Research (2016)
oft_Research_(2016).pdf
How to Read a Paper (Feb 17th 2016)
How to Test 10G Ethernet - WhitePaper - Spirent (March, 2012)
arch,_2012).pdf
How to use Event Tracing for Windows for Performance Analysis
How to Write Fast Code - SIMD Vectorization - CMU - 2008 - Slides (slides-18-645-simd)
How To Write Fast Numerical Code - Slides (2011)
How To Write Shared Libraries - v4.1.2 (Drepper, 2001)
f
HTTP as the Narrow Waist of the Future Internet
Huffman Coding - Slides (2012)
HyperANF - Approximating the Neighbourhood Function of Very Large Graphs on a Budget (2011)
Hyperedge Replacement Graph Grammars
Hypergraph Algorithms and Applications - CS6824 - Slides  (January 22, 2014)
ons_-_CS6824_-_Slides__(January_22,_2014).pdf
Hypergraph-Based Anomaly Detection in Very Large Networks - 2007 (silva_willett_tpami07)
Hypergraphs - Algorithms, Implementations, and Applications - Poster (2015)
HyperLogLog - The Analysis of a Near-Optimal Cardinality Estimation Algorithm (914-3045-2-PB)
Hyperparameter Optimization using Hyperopt - Slides (2016)
iBFS - Concurrent Breadth-First Search on GPUs - 2016 (ibfs_tcm18-284417)
_on_GPUs_-_2016_(ibfs_tcm18-284417).pdf
IBM DB2 for i - Indexing Methods and Strategies
IBM Fibre Channel Basic Storage Area Network (SAN) Configuration Setup Guide
IDA Plug-in Writing in C-C++ - Version 1.1 - Steve Micallef (2009)
Ideal Hash Trees - Phil Bagwell - ACM
IDF 2012 NVM Express and the PCI Express SSD Revolution
IEEE 802.3ad Link Aggregation
I Got 99 Problems But a Kernel Pointer Ain't One - Recon 2013 - Slides - Alex Ionescu
Image and Video Processing - Binary Encoding and Quantization (2016)
IMP - Indirect Memory Prefetcher - MIT (2015)
Implementing Algebraic Effects in C, or, Monads for Free in C - 2017 (algeff-in-c-tr-v2)
Implementing Sorting in Databases (2006)
Improved Bounds For Covering Complete Uniform Hypergraphs - (April 3rd, 2007)
Improved Fast Similarity Search in Dictionaries - 2010 (1008.1191v2)
Improvement of Fitch function for Maximum Parsimony in Phylogenetic Reconstruction with Intel AVX2 Assembler Instructions - 24
_Intel_AVX2_Assembler_Instructions_-_24_June_2013_(TR20130624-1).pdf
Improving Automated Analysis of Windows x64 Binaries - Uninformed v4a1 (April 2006)
_of_Windows_x64_Binaries_-_Uninformed_v4a1_(April_2006).pdf
Improving Compiler Optimization with Machine Learning (2014_Kulkarni_Sameer_PhD)
Improving Python's Memory Allocator - Evan Jones (2005)
Improving Real-Time Performance with CUDA Persistent Threads (CuPer) on the Jetson TX2 - Concurrent Real-Time White Paper (201
Improving the speed of neural networks on CPUs (37631)
f
Incremental Construction of Minimal Acyclic Finite State Automata and Transducers
nimal_Acyclic_Finite_State_Automata_and_Transducers.pdf
Index Compression - Slides (2011)
Index Compression - Slides
Index Internals - Rebuilding the Truth
Index Search Algorithms for Databases and Modern CPUs - Florian Gloss (Nov 2010)
Induced subgraphs of hypercubes and a proof of the Sensitivity Conjecture (2019)
_and_a_proof_of_the_Sensitivity_Conjecture_(2019).pdf
Infinite-Alphabet Prefix Codes Optimal for Beta-Exponential Penalties (10.1.1.560.4484)
Information Retrieval - Compression, Encoding - Slides - Cornell (2013)
oding_-_Slides_-_Cornell_(2013).pdf
Information Theory for Intelligent People (2018)
Initial End-to-End Performance Evaluation of 10-Gigabit Ethernet - 2003 (hoti03)
InK-Compact- In-Kernel Stream Compaction and Its Application to Multi-Kernel Data Visualization on General-Purpose GPUs - 2013
Inline Function Expansion for Compiling C Programs - 1989 (p246-chang)
In-memory Columnar Store for PostgreSQL (322_IMCS)
Inside IOCP
Inside The Deal That Made Bill Gates 350,000,000 (1986)
Inside the Python GIL - Dave Beazley (2009)
Instant Loading for Main Memory Databases - 2013 (p1702-muehlbauer)
Instant Loading for Main Memory Databases - VLDB - 2013, Vol 6, No 14 (p1702-muehlbauer)
n_Memory_Databases_-_VLDB_-_2013,_Vol_6,_No_14_(p1702-muehlbauer).pdf
Integer Encoding - Chapter 9 (2013)
Intel 5th Generation Processor Family - Specification Update - Revision 029 - July 2017 (330836-029)
Intel 64 and IA-32 Architectures Optimization Reference Manual - April 2018 (248966-040)
itectures_Optimization_Reference_Manual_-_April_2018_(248966-040).pdf
Intel 64 and IA-32 Architectures Optimization Reference Manual - April 2019 (248966-041)
itectures_Optimization_Reference_Manual_-_April_2019_(248966-041).pdf
Intel 64 and IA-32 Architectures Optimization Reference Manual - December 2017 (248966-039)
Intel 64 and IA-32 Architectures Optimization Reference Manual - June 2016 (248966-033)
tectures_Optimization_Reference_Manual_-_June_2016_(248966-033).pdf
Intel 64 and IA-32 Architectures Optimization Reference Manual - May 2020 (248966-043)
Intel 64 and IA-32 Architectures Optimization Reference Manual - Sept 2014 (248966-030)
tectures_Optimization_Reference_Manual_-_Sept_2014_(248966-030).pdf
Intel 64 and IA-32 Architectures Performance Monitoring Events - Revision 1.0 - December 2017 (335279-001)
Intel 64 and IA-32 Architectures Software Developer's Manual - Combined Volumes 1-3 - June 2016 (325462-059US)
ntel_64_and_IA-32_Architectures_Software_Developer's_Manual_-_Combined_Volumes_1-3_-_June_2016_(325462-059US).pdf
arner.net
Intel 64 and IA-32 Architectures Software Developer's Manual - Combined Volumes 1-3 - Sept 2014 (325462-052US)
ntel_64_and_IA-32_Architectures_Software_Developer's_Manual_-_Combined_Volumes_1-3_-_Sept_2014_(325462-052US).pdf
arner.net
Intel 64 and IA-32 Architectures Software Developer's Manual - Combined Volumes 1-4 - December 2017 (325462-sdm-vol-1-2abcd-3a
Intel 64 and IA-32 Architectures Software Developer's Manual - Combined Volumes 1-4 - May 2018 (325462-sdm-vol-1-2abcd-3abcd)
Intel 64 and IA-32 Architectures Software Developer's Manual - Combined Volumes 1-4 - May 2019 (325462-sdm-vol-1-2abcd-3abcd)
Intel 64 and IA-32 Architectures Software Developer's Manual - Combined Volumes 1-4 - October 2019 (325462-071US-sdm-vol-1-2ab
d-3abcd)
462-071US-sdm-vol-1-2abcd-3abcd).pdf
Intel 64 and IA-32 Architectures Software Developer's Manual - Documentation Changes - June 2016 (252046-051)
Intel 64 and IA-32 Architectures Software Developer's Manual - Documentation Changes - May 2019 (252046-062)
Intel 64 and IA-32 Architectures Software Developer’s Manual V3 - Sept 2014 (325384-052US)
Intel 64 and IA-32 Architectures Software Developer's Manual - Volume 2A - Instruction Set Reference, A-L - June 2016 (253666-
59US)
Intel 64 and IA-32 Architectures Software Developer's Manual - Volume 2B - Instruction Set Reference, M-U - June 2016 (253667-
59US)
Intel Advanced Encryption Standard (AES) New Instructions Set
Intel Advanced Encryption Standard (AES) New Instructions Set - White Paper - Rev 3.0, May 2010 (323641-001)
Intel Advanced Vector Extensions, 2015-2016, Support in GNU C Compiler Collection, GNU Tools Cauldron 2014 (Cauldron14_AVX-512
tion,_GNU_Tools_Cauldron_2014_(Cauldron14_AVX-512_Vector_ISA_Kirill_Yukhin_20140711).pdf
Intel - Advanced Vector Extensions (319433-014)
Intel - A Novel Hashing Method Suitable for Lookup Functions  (February 2012)
table_for_Lookup_Functions__(February_2012).pdf
Intel Architecture Code Analyzer - User's Guide - v3.0 (2017)
Intel Architecture - Instruction Set Extensions and Future Features - Programming Reference (January 2018)
Intel Architecture - Instruction Set Extensions and Future Features - Programming Reference - March 2020 (319433-038)
h/tpn/Intel_Architecture_-_Instruction_Set_Extensions_and_Future_Features_-_Programming_Reference_-_March_2020_(319433-038).pd
Intel Architecture - Instruction Set Extensions and Future Features - Programming Reference - May 2019 (319433-037)
Intel Architecture Instruction Set Extensions Programming Reference (319433-015)
Intel Architecture Instruction Set Extensions Programming Reference (319433-017)
Intel Architecture Instruction Set Extensions Programming Reference - April 2017 (319433-029)
Intel Architecture Instruction Set Extensions Programming Reference - Feb 2016 (319433-024)
nstruction_Set_Extensions_Programming_Reference_-_Feb_2016_(319433-024).pdf
Intel Architecture Instruction Set Extensions Programming Reference - January 2018 (319433-032)
Intel Architecture Instruction Set Extensions Programming Reference - Oct 2014 (319433-022)
nstruction_Set_Extensions_Programming_Reference_-_Oct_2014_(319433-022).pdf
Intel Architecture Instruction Set Extensions Programming Reference - Sep 2016 (319433-025)
nstruction_Set_Extensions_Programming_Reference_-_Sep_2016_(319433-025).pdf
Intel - Avoiding AVX-SSE Transition Penalties (11MC12_Avoiding_2BAVX-SSE_2BTransition_2BPenalties_2Brh_2Bfinal)
Intel AVX-512 Architecture - Poster - 2013 (Demikhovsky-Poster)
khovsky-Poster).pdf
Intel AVX-512 Instructions and Their Use in the Implementation of Math Functions - Slides (s1-cornea)
Intel - Cache Allocation Technology - Whitepaper (2015)
Intel Carry-Less Multiplication Instruction and its Usage for Computing the GCM Mode - Revision 2.0 (323640-001, May 2010)
Intel Compiler Features + Performance Tips - Slides (2015) (IntelCompilerNERSC.201505013)
Intel Compiler Optimization and Building for KNL - Slides (2016)
Intel Ethernet Controller 82571EB, 82572EI, 82571GB, 82571GI - Specification Update - Rev 6.8 Nov 2014
ernet_Controller_82571EB,_82572EI,_82571GB,_82571GI_-_Specification_Update_-_Rev_6.8_Nov_2014.pdf
Intel - Improving Real-Time Performance by Utilizing Cache Allocation Technology - Whitepaper (April 2015)
Intel IO Acceleration Technology (IOAT) Overview
Intel IO Acceleration Technology Overview (2006)
Intel IO Acceleration Technology Overview
0
Intel - Mitigations for Jump Conditional Code Erratum - Revision 1.0 (Nov 2019)
Intel Multimedia Instructions (MMX, SSE, SSE2, SSE3 and SSE4) - Slides
Intel PCI Express Ethernet Networking - White Paper - Sept 2005
Intel - PMU Sharing Guidelines (30388)
Intel Pro-1000 PT Quad Port Bypass Server Adapter
Intel Pro-1000 PT Quad Port LP Server Adapter - Product Brief
Intel SIMD Architecture - Yung-Yu - UCONN (2007)
Intel SIMD - Austronomy and Space Science - Slides (DIFX_2014-SIMD)
Intel Technical Journal - MMX (1997-vol01-iss-3-intel-technology-journal)
Intel - Unleash the Power of AVX-512 through Architecture, Compiler and Code Modernization - Slides - September 2012 (2016-PAC
Intel - _vectorcall and __regcall Demystified
Intel Xeon E5 Product Family - Specification Update - Revision 020 - February 2017 (326510-020)
Intel Xeon Phi Coprocessor Datasheet (April 2014)
Intel Xeon Phi - System Software Developers Guide (Nov 2012)
Intel Xeon Processor E5 v2 and E7 v2 Product Families - Uncore Performance Monitoring - Reference Manual - February 2014 (3294
Intel Xeon Processor E7 Family - Uncore Performance Monitoring - Programming Guide - April 2011 (325294-001)
Intel Xeon Scalable Processor - Throughput Latency
Interrupts in Linux - Slides (L07-LinuxEvents)
Interval hash tree - An efficient index structure for searching object queries in large image databases (caivd99)
Introduction to AMD GPU Programming with HIP - 2019 (AMD_GPU_HIP_training_20190906)
ramming_with_HIP_-_2019_(AMD_GPU_HIP_training_20190906).pdf
Introduction to Coccinelle (Slides)
Introduction to Debugging the FreeBSD Kernel -BSDCan 2008
Introduction to Debugging the FreeBSD Kernel - Paper - BSDCan 2008
Introduction to DPDK - Slides (2015)
Introduction to Dynamic Unary Encoding (Dec 19, 2014)
Introduction to GPUs - CS378 - Spring 2015 - Slides
er.petergarner.net
Introduction to Intel Ethernet Flow Director
Introduction to Machine Learning - CMU-10701 - Deep Learning - Slides (Spring 2014)
Introduction to Mathematics for Game Development - James Cowley  (June 23, 2016)
Introduction to Parallel Architectures - Josep Torrellas - CS533 (2012)
Introduction to Probability and Statistics with R (IPSUR)
Introduction to Python for Computational Science and Engineering - A Beginner's Guide - September 7th, 2015
Introduction to Random Graphs - Frieze and Karonski (Book)
Introduction to Random Graphs - Slides - 2015 (Slides_TomaszLuczak1)
15_(Slides_TomaszLuczak1).pdf
Introduction to the Pin Instrumentation Tool - Slides (27 Mar 2013)
Introduction to x64 Assembly
Introspection for C and its Applications to Library Robustness - 2017 (1712.01163)
Investigation of Hardware Transactional Memory - 2015 (Andrew-Nguyen-Thesis)
onal_Memory_-_2015_(Andrew-Nguyen-Thesis).pdf
IO is Faster Than the CPU - Let's Partition Resources and Eliminate (Most) OS Abstractions (parakernel-hotos19)
IRON File Systems (iron-sosp05)
iSAX 2.0 - Indexing and Mining One Billion Time Series
f
ispc - A SPMD Compiler for High-Performance CPU Programming (ispc_inpar_2012)
Item-Based Collaborative Filtering Recommendation Algorithms
It's Time for Low Latency (latency_hotos11)
Java Callstack Trace - HTTP to JDBC - 2006 (jtrac-callstack)
allstack).pdf
JavaScript Cheat Sheet
JavaScript - ECMA-262 Standard (v5.1, 2011)
Join-Idle-Queue- A Novel Load Balancing Algorithm for Dynamically Scalable Web Services - October 1, 2011 (idleq)
Joint Strike Fighter Air Vehicle C++ Coding Standards - Dec 2005 (Doc. 2RDU00001 Rev. C)
r_Vehicle_C++_Coding_Standards_-_Dec_2005_(Doc._2RDU00001_Rev._C).pdf
Jump Over ASLR - Attacking Branch Predictors to Bypass ASLR - 2016 (micro16)
Jump the Queue to Lower Latency - USENIX - April 2015 (login_apr15_02_grosvenor_041315)
Kam1n0 - MapReduce-based Assembly Clone Search for Reverse Engineering - 2016 (DFC16kdd)
K - A Rewriting-Based Framework for Computations (rosu-2007-tr-c)
k-Ary Search on Modern Processors
KASLR is Dead - Long Live KASLR (2017)
Keccak and the SHA-3 Standardization - Slides (Feb 6th, 2013)
Kerncraft - A Tool for Analytic Performance Modeling of Loop Kernels - 2018 (1702.04653)
Kernel Debugging with Windbg
Kernel-Mode Driver Architecture Design Guide (Microsoft)
Kernel Patch Tutorial
Kernel Pool Exploitation on Windows 7 (BlackHat_DC_2011_Mandt_kernelpool-wp)
_7_(BlackHat_DC_2011_Mandt_kernelpool-wp).pdf
KLAP - Kernel Launch Aggregation and Promotion for Optimizing Dynamic Parallelism (2016)
gregation_and_Promotion_for_Optimizing_Dynamic_Parallelism_(2016).pdf
KLEE - Unassisted and Automatic Generation of High-Coverage Tests for Complex Systems Programs (klee-osdi-2008)
KMDF - How To Develop Framework Drivers - Microsoft - Slides (2007)
crosoft_-_Slides_(2007).pdf
Know Your HTTP Status Codes
Latency and Bandwidth Impact on GPU Systems - 2008 (ms-proj-gpgpu-latency-bandwidth)
t_on_GPU_Systems_-_2008_(ms-proj-gpgpu-latency-bandwidth).pdf
LATEX for Computer Scientists - 15th May 2006
Lazy and Speculative Execution - Microsoft Research - Slides (12th December, 2006)
Lazy Asynchronous IO for Event-Driven Servers
Learning a Hidden Hypergraph - 2006 (angluin06a)
Learning Statistics with R (lsr-0.5)
Learning with Hypergraphs - Clustering, Classification, and Embedding (2017)
Lecture 11 - Programming on GPUs - Part 1 - Slides (Lec-11-GPU)
es_(Lec-11-GPU).pdf
Lecture Notes on AVL Trees - March 2011 (18-avl)
Lecture Notes on Linear Algebra (2015)
Less Hashing, Same Performance - Building a Better Bloom Filter - 2008 (10.1.1.152.579)
Let your GPU do the Heavy Lifting in your Data Warehouse - Slides - 2013 (S3190-GPU-Heavy-Lifting-Data-Warehouse)
Leveraging Compression in In-Memory Databases - 2012 (dbkda_2012_6_20_30160)
libtorque - Portable Multithreaded Continuations for Scalable Event-Driven Programs
readed_Continuations_for_Scalable_Event-Driven_Programs.pdf
Lightweight Contention Management for Efficient Compare-and-Swap Operations
Linear Algebra Abridged - Sheldon Axler (13th March, 2016)
Linear Algebra
Linear Road - A Stream Data Management Benchmark (2004)
Linked List Problems - Stanford (2002)
Linux Block IO - Introducing Multi-queue SSD Access on Multicore Systems
LinuxCon 2009 - 10Gbs Bi-directional Routing
Linux - FS Workshop
Linux Kernel Architecture for Device Drivers (Thomas Petazzoni)
omas_Petazzoni).pdf
Linux Productivity Tools - Slides - 2019 (lisa19_maheshwari)
Linux Symposium 2004 - All
LMAX Disruptor - High performance alternative to bounded queues for exchanging data between concurrent threads (Disruptor-1.0)
Locality Exists in Graph Processing - Workload Characterization on an Ivy Bridge Server
_Processing_-_Workload_Characterization_on_an_Ivy_Bridge_Server.pdf
Lock-free Concurrent Data Structures - 12 Feb 2013 (1302.2757)
3_(1302.2757).pdf
Lockless Programming - GDC 2009 - Slides (Bruce Dawson)
Locks, Deadlocks and Synchronization - Windows Hardware and Driver Central (2006)
zation_-_Windows_Hardware_and_Driver_Central_(2006).pdf
Logistic Regression
Lonestar- A Suite of Parallel Irregular Programs (ispass2009)
Longest Common Extension with Recompression - 16th Nov 2016 (1611.05359)
sion_-_16th_Nov_2016_(1611.05359).pdf
Long Gaps Between Primes - 2016 (1412.5029)
Long-term Recurrent Convolutional Networks for Visual Recognition and Description (1411.4389v3)
Loop Independence, Compiler Vectorization and Threading of Loops (SSE and AVX) - Intel - Slides
e,_Compiler_Vectorization_and_Threading_of_Loops_(SSE_and_AVX)_-_Intel_-_Slides.pdf
Lossless Compression in Lossy Compression Systems - Stanford, EE398A - Slides (01-EntropyLosslessCoding)
s_Compression_in_Lossy_Compression_Systems_-_Stanford,_EE398A_-_Slides_(01-EntropyLosslessCoding).pdf

Lossless Source Coding (03_Lossless-Coding-WS12)
Lower Bound Techniques for Data Structures
LSM-trie - An LSM-tree-based Ultra-Large Key-Value Store for Small Data - Slides (atc15_slides_wu)
LSM-trie - An LSM-tree-based Ultra-Large Key-Value Store for Small Data (wu15-lsm-trie)
lwref - BSDCan2014 - FreeBSD
Lynx - Using OS and Hardware Support for Fast Fine-Grained Inter-Core Communication (mitropoulou16-ics)
M4 - A Visualization-Oriented Time Series Data Aggregation (p797-jugel)
Mach - A New Kernel Foundation for UNIX Developers (accetta86)
Mach - A New Kernel Foundation for UNIX Developers (mach_usenix86)
Machine Learning - The High-Interest Credit Card of Technical Debt - Google (43146)
Magazines and Vmem- Extending the Slab Allocator to Many CPUs and Arbitrary Resources
ing_the_Slab_Allocator_to_Many_CPUs_and_Arbitrary_Resources.pdf
Maintaining Knowledge about Temporal Intervals - 1983
Making Lockless Synchronization Fast - Performance Implications of Memory Reclamation (hart_ipdps06)
Making networking apps scream on Windows with DPDK
Managing the Development of Large Software Systems - 1970 (waterfall)
Managing the Google T1-5 Relational Database (10.1.1.456.9390)
Managing Traffic with ALTQ
Markov Chains and Random Walks
MARX - Uncovering Class Hierarchies in C++ Programs - (NDSS 2017)
Massively-Parallel Similarity Join, Edge-Isoperimetry, and Distance Correlations on the Hypercube - 15th Nov 2016 (1611.04999)
6_(1611.04999).pdf
Massively Parallel Sort-Merge Joins in Main Memory Multi-Core Database Systems - 2012 (p1064_martina-cezaraalbutiu_vldb2012)
Mastering the Game of Go with Deep Neural Networks and Tree Search
Matchings, Hamilton Cycles and Cycle Packings in Uniform Hypergraphs - 2005 (dmAE0154)
Matchings in 3-uniform Hypergraphs (2012)
0
Matchings in k-partite k-uniform Hypergraphs (Feb 17th, 2018)
Matchings in k-partite k-uniform Hypergraphs
Mathematics for Computer Science (2012)
Mathematics for Computer Science (2018)
Math for Machine Learning (2009)
Maximally Consistent Sampling and the Jaccard Index of Probability Distributions - 2018 (1809.04052)
Maximizing File Transfer Performance Using 10Gb Ethernet and Virtualization - FedEx Case Study - Intel (2010)
Maximizing GPU Throughput Across Multiple Streams - Tips and Tricks - Slides (s7393-chuck-seberino-maximizing-gpu)
Maximizing Performance of PC Games on 64-bit Platforms (AMD_GDC_2005_Mike_Wall)
Measuring the Impact of Event Dispatching and Concurrency Models on Web Server Performance Over High-speed Networks
MegaPipe - A New Programming Interface for Scalable Network IO
Mellanox ConnectX-2 10GbE Cards - Product Data Sheet
Meltdown (2018)
Memory Barriers - a Hardware View for Software Hackers (July 23, 2010)
Memory Efficient Hard Real-Time Garbage Collection (2003)
03).pdf
Memory-Efficient Search Trees for Database Management Systems - Feb 2020 - Thesis (CMU-CS-20-101)
Memory Ordering in Modern Microprocessors (ordering.2007.09.19a)
Mental models, Consistency and Programming Aptitude (CRPITV78Bornat)
MGtoolkit - A Python Package for Implementing Metagraphs (2017)
Microsoft Portable Executable and Common Object File Format Specification - 1999 (pecoff)
Microsoft Portable Executable and Common Object File Format Specification - Revision 8.3 (6th Feb, 2013)

Microsoft Windows RPC Security Vulnerabilities
Microsoft Windows - Software Development Kit - Programmer's Learning Guide - Version 2.0 (1987)
Microsoft Windows - Software Development Kit - Programming Tools - Version 2.0 (1987)
Mihai Patrascu - Obituary and Open Problems
Minimal Perfect Hash Functions Made Simple - 1980 (p17-cichelli)
80_(p17-cichelli).pdf
MIPSpro C and C++ Pragmas (007-3587-005)
MIPSpro MIPSpro Assembly Language Programmer's Guide (007-2418-006)
Misomorphism - A Semiotic Model of Computer Security Circumvention - 2015 (TR2015-768)
_Model_of_Computer_Security_Circumvention_-_2015_(TR2015-768).pdf
Mison - A Fast JSON Parser for Data Analytics (p1118-li)
).pdf
MISTRAL - Processing Relational Queries Using a Multidimensional Access Method - 2000 - Slides and Comments
MISTRAL - Processing Relational Queries Using a Multidimensional Access Method - 2000 - Slides
ing_Relational_Queries_Using_a_Multidimensional_Access_Method_-_2000_-_Slides.pdf
Mixed Model Universal Software Thread-Level Speculation (ICCP2013)
Mobile Computing Research Is a Hornet's Nest of Deception and Chicanery
Modeling High-Frequency Limit Order Book Dynamics with Support Vector Machines
er_Book_Dynamics_with_Support_Vector_Machines.pdf
Modern C
Modern C v2 (2019)
Modern Microprocessors - A 90 Minute Guide
MonetDB-X100 - Hyper-Pipelining Query Execution (CIDR 2005 P19)
Monotone Minimal Perfect Hashing - Searching a Sorted Table with O(1) Accesses (1496770.1496856)
Monotone Minimal Perfect Hashing - Searching a Sorted Table with O(1) Accesses - 2014 (MonotoneMinimalPerfectHashing)
h/tpn/Monotone_Minimal_Perfect_Hashing_-_Searching_a_Sorted_Table_with_O(1)_Accesses_-_2014_(MonotoneMinimalPerfectHashing).pd
More Than You Ever Wanted to Know about Synchronization - Synchrobench, Measuring the Impact of the Synchronization on Concurr
MSDN - Compound Synchronization Objects (July 21, 1994)
MSDN - DLLs the Dynamic Way (November, 1999)
MSDN - Emulating Operating System Synchronization (October, 1997)
MSDN - Multithreading for Rookies (September 24, 1993)
f
MSDN - Multithreading Performance (January 31, 1996)
MSDN - Writing Scalable Applications for Windows NT (Revision 1.0 June 6, 1995)
MSDN - Writing Windows NT Server Applications in MFC Using IO Completion Ports (September, 1996)
Multi-Core, Main-Memory Joins - Sort vs. Hash Revisited - 2014 (p85-balkesen)
Multi-core with less pain - Deterministic Parallel Programming with Haskell
Multiple Byte Processing with Full-Word Instructions - Leslie Lamport (1975)
Name Mangling Demystified (2007)
Near-Optimal Space Perfect Hashing Algorithms - PhD Thesis (2008)
Networks of Collaborations - Hypergraph Modeling and Visualisation - 4th July, 2017 (1707.00115)
Network Stack Challenges at Increasing Speeds - The 100Gbs Challenge - RedHat 2015
ncreasing_Speeds_-_The_100Gbs_Challenge_-_RedHat_2015.pdf
Network Stack Specialization for Performance - 2013 (hotnets-final43)
Neural Turing Machines (1410.5401v2)
Neural Word Embedding as Implicit Matrix Factorization (5477-neural-word-embedding-as-implicit-matrix-factorization)
/tpn/Neural_Word_Embedding_as_Implicit_Matrix_Factorization_(5477-neural-word-embedding-as-implicit-matrix-factorization).pdf
opher.petergarner.net
New Approach for Graph Algorithms on GPU using CUDA - 2013 (10.1.1.402.6651)
New Cardinality Estimation Algorithms for HyperLogLog Sketches (1702.01284)
New sendfile(2) - FreeBSD (20 Feb 2015)
Next Generation Collaborative Reversing with Ida Pro and CollabREate - 2008 (BH_US_08_Eagle_Vidas_Collabreate_paper)
/tpn/Next_Generation_Collaborative_Reversing_with_Ida_Pro_and_CollabREate_-_2008_(BH_US_08_Eagle_Vidas_Collabreate_paper).pdf
opher.petergarner.net
Nobody ever got fired for using Hadoop on a Cluster - Microsoft 2012 (hotcbp12)
Nonblocking Algorithms and Scalable Multicore Programming - ACM (Samy Al Bahra)
Notes on Differential Equations
NTFS Cheat Sheet
NTFS Documentation
NTFS System Crash - Marius Tivadar - July 19th, 2017
NT Insider - 2017-01
NT Insider - 2017-02
Numba - Python Compiler for NumPy-SciPy
NumPy Binning Tutorial
NVDIMM Block Window Driver Writer's Guide - Intel (April 2015)
NVDIMM Namespace Specification - Intel (Revision 1.0, April 2015)
on_1.0,_April_2015).pdf
NVDIMM-N Cookbook - A Soup-to-Nuts Primer on Using NVDIMM-Ns to Improve Your Storage Performance - 2015 (Chang-Sainio_NVDIMM_C
NVIDIA - Cooperative Groups - Slides - GTC 2017 (s7622-Kyrylo-perelygin-robust-and-scalable-cuda)
NVIDIA CUDA 5.5 - Getting Started Guide for Windows - July 2013 (DU-05349-001_v5.5)
NVIDIA - Fermi Compute Architecture - Whitepaper - v1.1
NVIDIA - GeForce GTX 1080 Whitepaper - Gaming Perfected
NVIDIA - GeForce GTX 1080 - Whitepaper
NVIDIA - GeForce GTX 980 - Whitepaper
NVIDIA GPU Computing Webinars - CUDA Memory Optimization (2011)
mization_(2011).pdf
NVIDIA - Optimizing Parallel Reduction in CUDA - Slides
NVIDIA Tesla K80 Data Sheet
NVIDIA Tesla K80 GPU Accelerator (Tesla-K80-BoardSpec-07317-001-v05)
-BoardSpec-07317-001-v05).pdf
NVIDIA - Turing GPU Architecture - Graphics Reinveted
NVIDIA - Understanding and Using Atomic Memory Operations - Slides (S3101-Atomic-Memory-Operations)
erstanding_and_Using_Atomic_Memory_Operations_-_Slides_(S3101-Atomic-Memory-Operations).pdf
NVML - Implementing Persistent Memory Applications - 2015
NYSE OpenBook Ultra Spec v1.9
NYU CUDA Advanced Techniques 1 - Slides
NYU CUDA Advanced Techniques 2 - Slides
NYU CUDA Advanced Techniques 3 - Slides
NYU CUDA Advanced Techniques 4 - Slides
ObCaptureObjectName
Objconv - Instructions
Object-relative Addressing - Compressed Pointers in 64-bit Java Virtual Machines (P107_134)
One Billion Word Benchmark for Measuring Progress in Statistical Language Modeling (1312.3005v3)
On End-to-End Program Generation from User Intention by Deep Neural Networks - 2015 (1510.07211v1)
_Program_Generation_from_User_Intention_by_Deep_Neural_Networks_-_2015_(1510.07211v1).pdf
One Size Fits All - An Idea Whose Time Has Come and Gone - Relational Databases (icde05)
On Hamilton Cycle Decompositions of r-uniform and r-partite Hypergraphs
On the Construction and Application of Compressed Text Indexes (2004)
On the Data Access Issue (Or Why CPUs Are Starving) - EuroSciPy 2009
On the de Bruijn-Newman Constant (2009)
On-the-Fly Garbage Collection - An Exercise in Cooperation - Dijkstra (1978)
On the Implementation of Minimum Redundancy Prefix Codes (1997)
On the k-Independence Required by Linear Probing and Minwise Independece - December 25th, 2014 (1302.5127)
e_k-Independence_Required_by_Linear_Probing_and_Minwise_Independece_-_December_25th,_2014_(1302.5127).pdf
On the Performance of Bitmap Indices for High Cardinality Attributes - 2014 (822860, LBNL-54673)
On the Quest for an Acyclic Graph - 9th Oct, 2017 (1708.01745)
_(1708.01745).pdf
Open Crypto Audit Project - TrueCrypt (iSec)
OpenGIS Implementation Standard for Geographic Information - Simple Feature Access - Part 2 - SQL option v1.2.1
Open Source Kernel Enhancements for Low-Latency Sockets using Busy Poll - Intel (Whitepaper)
OpenVMS RTL String Manipulation (STR$) Manual - April 2006 (AA-PV6MD-TK)
Opportunistic Data Structures with Applications (2000)
f
Optimization of Generalized Unary Coding (1611.03353)
Optimizations in C++ Compilers - ACM - Nov 2019 (3371595.3372264)
9_(3371595.3372264).pdf
Optimizing and Interfacing with Cython - Slides - 2010 (cours_cython)
Optimizing For AMD Ryzen - Slides (GDC2017)
Optimizing Indirect Memory References with milk - 2016 (p299-kiriansky)
th_milk_-_2016_(p299-kiriansky).pdf
Optimizing Parallel Prefix Operations for the Fermi Architecture
Optimizing Parallel Reduction in CUDA (Slides)
Optimizing Pattern Matching
Optimizing TLS for High-Bandwidth Applications on FreeBSD - Netflix (asiabsd_2015_tls)
Oracle 11 Data Warehousing Guide (e25554)
0
Oracle 11g - Advanced Compression Whitepaper (Jan 2012)
Oracle 11gr1 Administrator's Guide (b28310)
Oracle 11gr1 Concepts (b28318)
Oracle 11gr1 Data Cartridge Developer Guide (b28425)
Oracle 11gr1 Reference (b28320)
Oracle 11gr1 SQL Language Reference (b28286)
Oracle 11gr2 Advanced Application Developer's Guide (e41502)
Oracle 11gr2 Application Developer's Guide (e24435)
er.petergarner.net
Oracle 11gr2 Data Warehousing Guide (e25555)
Oracle 11gr2 Object-Relational Developer's Guide (e11822)
22).pdf
Oracle 11gr2 Performance Tuning Guide (e41573)
Oracle 11gr2 PLSQL Language Reference (e25519)
Oracle 11gr2 PLSQL Packages and Types (e40758)
Oracle 11gr2 Text Reference (e24436)
Oracle 11gr2 VLDB and Partitioning Guide (e16541)
Oracle 12c - Utilities (E41528-05)
Oracle - Beginning Performance Tuning (Arup Nanda)
Oracle B-Tree Index Internals - Rebuilding the Truth (Richard Foote)
Oracle - Fraud and Anomaly Detection Using Oracle Advanced Analytic Option 12c (fraudoaa12c-1979769)
Oracle - Multitenant Databases (Arup Nanda)
Oracle - New Features for Developers in 12c (Arup Nanda)
Oracle - Partitioning Tips and Tricks (Arup Nanda)
Oracle PLSQL Coding Guidelines (Top Coder, 2006)
Oracle PLSQL in 12c (Arup Nanda)
Oracle Row Pattern Matching in Sequences of Rows
Oracle Spatial - Developing Location-Enabled Applications - Oracle Spatial Geocoding and Routing Engines

Oracle - Tips and Techniques for Statistics Gathering (Arup Nanda)
Oracle - Understanding Oracle Locking (Arup Nanda)
Oracle - x86 Assembly Reference Manual (817-5477)
Oral History of David Cutler - Computer History Museum - Feb 25 2016 (102717163-05-01-acc)
_Cutler_-_Computer_History_Museum_-_Feb_25_2016_(102717163-05-01-acc).pdf
Order-Preserving Key Compression for In-Memory Search Trees - 2003 (2003.02391)
Origins of the Simplex Method - George B. Dantzig - 1987 (a182708)
Outlier Detection (2005)
Out of the Tar Pit (2006)
Overlapping Matrix Pattern Visualization - A Hypergraph Approach (2008)
Overplotting - Unified Solutions under Abstract Rendering
Overview of RDMA on Windows
Ownership and Reference Counting based Garbage Collection in the Actor World - Ponylang (2015)
PageRank as a Function of the Damping Factor
Pandas, SciPy, NumPy - Cheat Sheet
Pandas v0.14.1
Pandoc User's Guide
Paper - B-Trees, Shadowing and Clones
Paper - Fractal Prefetching B-Trees
Paper - How to write Shared Libraries
Paper - Interleaving
Paper - The Need for Asynchronous, Zero-Copy Network IO
Paper - The Zephyr Abstract Syntax Description Language
Paper - Wegner Transactive Memory
Parallel Computation - CSE260 - Lecture 9 - Matrix Multiplication (Fall 2015)
Parallel Depth-First Search for Directed Acyclic Graphs - 2017 (nvr-2017-001)
rected_Acyclic_Graphs_-_2017_(nvr-2017-001).pdf
Parallel Depth-First Search for Directed Acyclic Graphs - 2018
Parallel Depth-First Search for Directed Acyclic Graphs - Paper (2018)
Parallel Depth-First Search for Directed Acyclic Graphs - Poster (2018)
_Acyclic_Graphs_-_Poster_(2018).pdf
Parallel Depth-First Search for Directed Acyclic Graphs - Slides (2018)
_Acyclic_Graphs_-_Slides_(2018).pdf
Parallelism in Randomized Incremental Algorithms (BGSS16)
Parallel Lossless Data Compression on the GPU
Parallel Programming with Transactional Memory (p38-drepper)
-drepper).pdf
Parallel Random Numbers - As Easy as 1, 2, 3 (2011)
er.petergarner.net
Parallel Scans and Prefix Sums - Slides (2013)
Parsing a SWIFT Message (May 2007)
Parsing Gigabytes of JSON per Second - 25 Feb 2019 (1902.08318)
19_(1902.08318).pdf
Partial Redundancy Elimination for Global Value Numbering
Pattern Matching using Suffix Trays, Arrays and Trees (2014)
Patterns Of Software - Tales from the Software Community
PC Assembly Language - 2006
PC Assembly Language (July 23, 2006)
PCI Express Basics
PeachPy - A Python Framework for Developing High-Performance Assembly Kernels (2013)
Peering Inside the PE - A Tour of the Win32 Portable Executable File Format - MSDN (1994)
Peering Inside the PE - A Tour of the Win32 Portable Executable File Format
e_Win32_Portable_Executable_File_Format.pdf
PE File Structure
PE Format Layout
PE Format Walkthrough
PE Injection Explained
Perfect Hash Families in Polynomial Time - Slides - October 2010 (552phf)
me_-_Slides_-_October_2010_(552phf).pdf
Perfect Hash Functions - Slides
Perfect Hashing for Data Management Applications - 2007 (0702159)
Perfect Matchings in 4-uniform hypergraphs (1st Feb, 2011)
Perfect Matchings in Large Uniform Hypergraphs with Large Minimum Collective Degree (2008)
Perfect matchings in r-partite r-graphs (2008)
Perfect matchings in r-partite r-graphs
Perfect Spatial Hashing
Performance Analysis of BSTs in System Software - 2004 (libavl)
Performance and Reliability Analysis Using Directed Acyclic Graphs - 1987 (10.1.1.380.4352)
ability_Analysis_Using_Directed_Acyclic_Graphs_-_1987_(10.1.1.380.4352).pdf
Performance Evaluation of Concurrent Lock-free Data Structures on GPUs (2012)
Performance Evaluation of Concurrent Lock-free Data Structures on GPUs - Slides (2012)
Performing Advanced Bit Manipulations Efficiently in General-Purpose Processors (hilewitz-PerformingBitManipulations)
h/tpn/Performing_Advanced_Bit_Manipulations_Efficiently_in_General-Purpose_Processors_(hilewitz-PerformingBitManipulations).pd
Persistence Programming Models for Non-Volatile Memory - July, 2015 (HPL-2015-59)
_for_Non-Volatile_Memory_-_July,_2015_(HPL-2015-59).pdf
Persistent Memory in Windows - 2017 (Tom_Talpey_Persistent_Memory_in_Windows_Server_2016)
Peter Hlavaty - Back To The CORE (syscan2015)
Pin - Building Customized Program Analysis Tools with Dynamic Instrumentation (2005)
Pin Tutorial - Slides (2007)
PLPython - Python inside the PostgreSQL RDBMS (Slides, EuroPython 2011)
PLWAH+ - A Bitmap Index Compressing Scheme - 2014 (jcao_c_plwah)
14_(jcao_c_plwah).pdf
Pointer Analysis
Polynomial-Time Perfect Matchings in Dense Hypergraphs - 2013 (stoc212fp-keevash)
ngs_in_Dense_Hypergraphs_-_2013_(stoc212fp-keevash).pdf
Pool Tag Quick Scanning for Windows Memory Analysis - 2016
Portable versus Open Instruction Set Architectures - 2016 (ieeemicro16_card_isa)
Porting Linux to a New Processor Architecture (elc-2016)
Porting of Win32 API WaitFor to Solaris (2001)
POSH - Python Object Sharing
POSIX Base - Issue 7 - 2013 (C138)
PowerShell Basic Cheat Sheet
Practical Data Compression for Modern Memory Hierarchies - July 2016 - CMU-CS-16-116 (1609.02067)
Practical File System Design - The Be Filesystem
Practical Implementations of Arithmetic Coding
Practical R (2013)
Preemptable Ticket Spinlocks - Improving Consolidated Performance in the Cloud
Prefix B-trees - 1977
Prefix Hash Tree - An Indexing Data Structure over Distributed Hash Tables
Prefix Sums and Their Applications (10.1.1.128.6230)
pre-print-oopsla16
Princeton - Lecture 19 - Virtual Memory
Principles of Computer System Design - An Introduction - Part II - Version 5.0 (part_ii_open_5_0)
Principles of Distributed Computing
Printing Floating-Point Numbers - An Always-Correct Method (fp-printing-popl16)
Printing Floating-Point Numbers Quickly and Accurately with Integers - 2010 (dtoa-pldi2010)
Proactor - An Object Behavioral Pattern for Demultiplexing and Dispatching Handlers for Asynchronous Events
Probabilistic Graph and Hypergraph Matching (2008)
Probability and Statistics Cookbook
Processing Relational Queries Using a Multidimensional Access Method - 2000 (ubtree-comments)
Production Tracing with Event Tracing for Windows (ETW) - MSBuild 2017 - Slides
Program Analysis with PREfast and SAL - Erik Poll - Slides (3_StaticAnalysisPREfast)
Program Analysis with PREfast & SAL - Slides (3_StaticAnalysisPREfast)
des_(3_StaticAnalysisPREfast).pdf
Program Design in the UNIX Environment.
Programming Interfaces to Non-Volatile Memory - Slides
f
Programming Satan's Computer (AndersonNeedham)
Programming with Hardware Lock Elision
Programming with the x87 Floating Point Unit - Intel
Program Synthesis By Sketching (EECS-2008-177)
Proof of Concept or GTFO - v13 (October 18th, 2016)
er.petergarner.net
Proof of Concept or GTFO - v17 (30th December, 2017)
Proofs and Refutations (1963)
Providing Safe, User Space Access to Fast, Solid State Disks (2012)
Proving the Correctness of Nonblocking Data Structures - ACM (p30-desnoyers)
PS4 Toolchain - 2013
P - Safe Asynchronous Event-Driven Programming - Microsoft Research Labs - November 2012 (tr-8)
Pseudo-Random Number Generators for Vector Processors and Multicore Processors - Agner Fog (2015)
P - Tutorial
Putting Coroutines to Work with the Windows Runtime - Kenny Kerr and James McNellis - CppCon 2016
PyEmu - A Multi-purpose Scriptable IA-32 Emulator (bh-usa-07-pierce-WP)
PyParallel - How We Removed The GIL And Exploited All Cores - (PyData NYC, 2013)
Python Bokeh Cheat Sheet
Pythran - Enabling Static Optimization of Scientific Python Programs
Quasi-Succinct Indices (2012)
Quick Introduction into SAT and SMT Solvers and Symbolic Execution (2016 - Draft)
QuickThread - Comparative analysis between QuickThread and Intel Threading Building Blocks (2009)
QuickThread - Comparison between QuickThread and OpenMP 3.0 under system loads (2009)
QuickThread - Programming Guide
QuickThread - Superscalar Programming 101 - Parts 1-5 (2009)
-5_(2009).pdf
RadixVM - Scalable address spaces for multithreaded applications
RadixVM - (Slides) Scalable address spaces for multithreaded applications
Rainbow matchings in r-partite r-graphs - 2009 (v16i1r119)
r119).pdf
Reactor - An Object Behavioral Pattern for Demultiplexing and Dispatching Handles for Synchronous Events

Realizing Quality Improvement Through Test Driven Development - Results and Experiences of Four Industrial Teams (nagappan_tdd
Real Programming in Functional Languages - James H. Morries (1981)
Real-Time Parallel Hashing on the GPU
Real World Concurrency
Reasoning about Temporal Relations - A Maximal Tractable Subclass of Allen's Interval Algebra (10.1.1.57.5336)
arner.net
Recognizing Unordered Depth-First Search Trees of an Undirected Graph in Parallel (2000)
Recollections of Early Chip Development at Intel
Reconsidering Custom Memory Allocation (berger-oopsla2002)
Reducing Cache Pollution Through Detection and Elimination of Non-Temporal Memory Accesses - 2010 (pap368s4)
ucing_Cache_Pollution_Through_Detection_and_Elimination_of_Non-Temporal_Memory_Accesses_-_2010_(pap368s4).pdf
Reducing the Space Requirement of Suffix Trees (Kurtz_SWPracticeandExperiment_1999)
Reevaluation of Programmed IO with Write-Combining Buffers to Improve IO Performance on Cluster Systems (NAS2015_kPIO+WC)
Refactoring the FreeBSD Kernel with Checked C - 2020 (freebsd_checkedc)
ked_C_-_2020_(freebsd_checkedc).pdf
Reflective DLL Injection v1.0 - Stephen Fewer (31st October 2008)
Register Level Sort Algorithm on Multicore SIMD Processors (xiaochen_rocki_IA3_SC13)
Regular and Almost-Universal Hashing - An Efficient Implementation (1609.09840)
hing_-_An_Efficient_Implementation_(1609.09840).pdf
Regular and Almost Universal Hashing - An Efficient Implementation - 2016 (1609.09840)
Relative Suffix Trees - 15th Dec, 2017 (1508.02550)
er.petergarner.net
Remote Library Injection (April 6th 2004)
0
Repeating History Beyond ARIES - C. Mohan (VLDB Conf, 1999)
Replacing Suffix Trees with Enhanced Suffix Arrays (2004)
04).pdf
Resumable Functions v3 - Microsoft C++ (n4286)
Rethinking SIMD Vectorization for In-Memory Databases (2015)
es_(2015).pdf
Retroactive Data Structures (2012)
Retrofitting Word Vectors to Semantic Lexicons - 2015 (15HLT-retrofitting-word-vectors)
Reverse Engineering for Beginners
Reverse-Engineering Instruction Encodings - 2000 (derive-usenix01)
Rewriting History - USC FBE Finance Seminar - (F_2-15-07_MALLOY-Anonymous)
Rewriting x86 Binaries without Code Producer Cooperation (wartell12thesis)
Rich vs King - The Entrepreneur's Dilemma - Harvard (2006)
Ring 0 to Ring-1 Attacks - Hyper-V IPC Internals - Alex Ionescu (syscan2015)
Rise of the VMs (Slides)
Robust Combinatorial Optimization with Exponential Scenarios (November 10th, 2006)
Safe Concurrent Programming and Execution
0
Safe Memory Reclamation for Dynamic Lock-Free Objects Using Atomic Reads and Writes - 2002 (podc-2002)
SALSA - Scalable and Low Synchronization NUMA-aware Algorithm for Producer-Consumer Pools (spaa049-gidron)
Satisfiability Modulo Theories - An Appetizer - Microsoft Research - Slides - 2009 (sbmf09-slides)
SC11 - Overview of RDMA on Windows
Scalable Lock-Free Dynamic Memory Allocation (pldi-2004)
Scaling Address Space Operations on Linux with TSX (2011)
11).pdf
Scheduling, Thread Context and Synchronization - Windows Hardware and Driver Central (2004)
SciPy 1.0 - Fundamental Algorithms for Scientific Computing in Python - 2020 (s41592-019-0686-2)
Scrambled Linear Pseudorandom Number Generators
Screaming Fast Galois Field Arithmetic Using Intel SIMD Instructions (FAST-2013-GF)
Scriptable Operating Systems with Lua
SCSI Command Table
Security Engineering - Ross Anderson (v1)
0
SEDA - An Architecture for Well-Conditioned, Scalable Internet Services - Deck (seda-sosp01-talk)
itecture_for_Well-Conditioned,_Scalable_Internet_Services_-_Deck_(seda-sosp01-talk).pdf
SEDA - An Architecture for Well-Conditioned, Scalable Internet Services - Dissertation (mdw-phdthesis)
SEDA - An Architecture for Well-Conditioned, Scalable Internet Services (seda-sosp01)
Sega Saturn (ST-238-R1-051795)
Self-Adjusting Binary Search Trees (1985)
0
Self-Verifying Execution (Position Paper) - Microsoft Research (2016)
Semantic Patches - Documenting and Automating Collateral Evolutions in Linux Device Drivers (ols07-padioleau)
Seminars - A Collection of Materials on Seminar Approaches and Evaluation Strategies
Sequence to Sequence Learning with Neural Networks (1409.3215v3)
Sequent Calculus as a Compiler Intermediate Language - ICFP (2016)
Shining Light on Shadow Stacks - 7 Nov 2018 (1811.03165)
).pdf
Shuffler - Fast and Deployable Continuous Code Re-Randomization - 2016 (shuffler-osdi16)
Shuffle - Tips and Tricks - Slides - GPU Tech Conf 2013 (S3174)
SIMD at Insomniac Games (How We Do The Shuffle) - Slides - 2015
SIMD Compression and the Intersection of Sorted Integers (1401.6399v11)
SIMD Compression and the Intersection of Sorted Integers - 2015 (1401.6399v12)
tion_of_Sorted_Integers_-_2015_(1401.6399v12).pdf
SIMD Compression and the Intersection of Sorted Integers (simdcompressionarxiv)
SIMD Parallelization of Applications that Traverse Irregular Data Structures
SIMD Vectorization of Histogram Functions (10.1.1.80.9041)
SIMNET and Beyod - A History of the Development of Distributed Simulation - 2015 (2015_FellowPaper_Miller)
Simple and Space-Efficient Minimal Perfect Hash Functions - 2007 (wads07)
Simple Image File Formats - PPM Format
Simple implementation of deletion from open-address hash table (0909.2547)
Sine and Cosine using CORDIC
SipHash - A Fast, Short-Input PRF - 18th Sept 2012 (2117_siphash)
Skip Lists - A Probabilistic Alternative to Balanced Trees - 1990 (pugh-skiplists-cacm1990)
SLAM and Static Driver Verifier- Technology Transfer of Formal Methods inside Microsoft (tr-2004-08)
SMT and Z3 - Microsoft Research - Slides (2009)
Snel - SQL Native Execution for LLVM - 21 Feb 2020 (2002.09449)
20_(2002.09449).pdf
Software Engineering Code of Ethics
Software Tracing - Slides - Microsoft 2003
Software Transactional Memory - Why Is It Only a Research Toy (p46-cascaval)
Solaris 10 System Administration Guide - Solaris Fibre Channel Storage Configuration and Multipathing Support Guide
Solaris 11 - Cheat Sheet (1556378)
Solaris Dynamic Tracing Guide (817-6223)
Solaris Internals - Core Kernel Architecture
Sorting improves word-aligned bitmap indexes - 2014 (0901.3751v6)
SpaceJMP - Programming with Multiple Virtual Address Spaces - 2016 (spacejmp_asplos16)
th_Multiple_Virtual_Address_Spaces_-_2016_(spacejmp_asplos16).pdf
SPARC - v9 Architecture Manual
Specialising Dynamic Techniques For Implementing The Ruby Programming Language
SPECK - A Kernel for Scalable Predictability (rtas15speck)
peck).pdf
Spectre Attacks - Exploiting Speculative Execution (2018)
18).pdf
Speeding up Networking - Precision IO
Spin-Based Reader-Writer Synchronization for Multiprocessor Real-Time Systems_
Spread Unary Coding (1412.6122)
SQLGraph - An Efficient Relational-Based Property Graph Store - 2015 (43287)
Staring Into The Abyss - An Evaluation of Concurrency Control with One Thousand Cores (p209-yu)
Statis - Flexible Transactional Storage (EECS-2010-2)
Statistically adaptive learning for a general class of cost functions (SA L-BFGS) (1209.0029v3)
aptive_learning_for_a_general_class_of_cost_functions_(SA_L-BFGS)_(1209.0029v3).pdf
Stochastic Gradient Descent Tricks (Microsoft Research, 2012)
STOPLESS - A Real-Time Garbage Collector for Multiprocessors (10.1.1.108.322)
Storing a Sparse Table with O(1) Worst Case Access Time - 1984 (fks-perfecthash)
)_Worst_Case_Access_Time_-_1984_(fks-perfecthash).pdf
Stratified B-trees and Versioning Dictionaries - 2011 (1103.4282v2)
es_-_2011_(1103.4282v2).pdf
Stratified B-trees and Versioning Dictionaries - 30 March 2011 (1103.4282v2)
Stratified Synthesis - Automatically Learning the x86-64 Instruction Set - 2016 (pldi16-strata)
esis_-_Automatically_Learning_the_x86-64_Instruction_Set_-_2016_(pldi16-strata).pdf
Streaming Data Mining
Streaming Store Instructions in the Intel Xeon Phi coprocessor - Slides (2012)
Strongly Universal String Hashing is Fast - 15 May 2014 (1202.4961)
Structured Deferral - Synchronization via Procrastination - ACM (p20-mckenney)
Structured Exception Handler Exploitation (17505)
Suffix Trees - Slides (Ben Langmead, Johns Hopkins)
er.petergarner.net
Sum of Degrees of Vertices Theorem - Slides
System V Application Binary Interface (ABI) AMD64 Architecture Processor Supplement - v0.99.6 (October 7, 2013)
System V Application Binary Interface AMD64 Architecture Processor Supplement
Tackling Latency Using FG (TR2011-706)
Taming Win32 Threads with Static Analysis - Slides (08161-yangjasonyue-slides)
Tango - Distributed Data Structures over a Shared Log
TCP Fast Open
Temporally Bounding TSO for Fence-Free Asymmetric Synchronization - 2015 (asplos2015-tbtso)
Ten Lessons I Wish I Had Learned Before I Started Teaching Differential Equations
TensorFlow - Large-Scale Machine Learning on Heterogeneous Distributed Systems (Nov 9th, 2015)
e-Scale_Machine_Learning_on_Heterogeneous_Distributed_Systems_(Nov_9th,_2015).pdf
Ten Years with DragonFlyBSD Network Stack (2017)
Tesla - GPU Computing - Past, Present and Future - Slides (2011)
Test-driving Intel Xeon Phi - 2013 (p137)
0
TestU01 - A Software Library in ANSI C for Emperical Testing of Random Number Generators - 2013 (guideshorttestu01)
The 12 Commandments of Synchronization - October 4, 2011 (10.1.1.227.3871)
The Allure of Machine Learning - Azure ML
0
The ART of Practical Synchronization (2016)
The AWK Programming Language (1988)
The Bias Against Creativity - Why People Desire But Reject Creative Ideas (Cornell, 1-1-2011)
The Burrows-Wheeler Algorithm - Daniel Schiller (August 5th, 2012)
The Bw-Tree - A B-tree for New Hardware Platforms (Microsoft Research)
The Cache Performance and Optimizations of Blocked Algorithms - 1991 (lam-asplos91)
The C and C++ Memory Model
The chemfp Project - 2019 (s13321-019-0398-8)
The Continuous Linked Settlement (CLS) Foreign Exchange Settlement System
The Dark Side of Winsock (DC_13-Levin)
The Datacenter as a Computer - Designing Warehouse-Scale Machines - 3rd Edition (00874ed3v01y201809cac046)
The Dataflow Model - A Practical Approach to Balancing Correctness, Latency, and Cost in Massive-Scale, Unbounded, Out-of-Orde
_Cost_in_Massive-Scale,_Unbounded,_Out-of-Order_Data_Processing_(p1792-Akidau).pdf
The Data Plane Development Kit (DPDK) - What it is and where it's going - Slides
The Death of Optimizing Compilers (slides-djb-20150416-a4)
6-a4).pdf
The Debugging Application Programming Interface - MSDN (1992)
The Design and Implementation of Modern Column-Oriented Database Systems (abadi-column-stores)
The Design of a High-Performance File Server - 1989 (10.1.1.38.5481)
The Development of JOVIAL - 1978 (p203-schwartz-jovial)
The DragonFlyBSD System (2004)
The Economics of Immediate Gratification (jbdmfinal)
The Elements of Statistical Learning - Data Mining, Inference and Prediction - 2nd Edition (ESLII_print4)
The Evolution of Effective B-tree Page Organization and Techniques - A Personal Account - David Lomer, Microsoft Research (a1-
rosoft_Research_(a1-lomet).pdf
The Evolution of Operating Systems (2001b)
The Forgotten Interface - Windows Named Pipes - Gil Cohen - Slides (2017)
The Function of Dream Sleep - Nature Vol. 304 (14th July, 1983)
4th_July,_1983).pdf
The Hideous Name - 1985 (pike85hideous)
The IBM POWER8 Review - Challenging the Intel Xeon - Anandtech (2015)
The Impact of the Lambda Calculus in Logic and Computer Science (1997)
c_and_Computer_Science_(1997).pdf
The Influence of Organizational Structure On Software Quality - An Empirical Case Study (tr-2008-11)
The K Semantic Framework (CS422-Spring-2010-K)
The Linux Kernel Hidden Inside Windows 10 - Alex Ionescu - Slides - Black Hat 2016
e_Windows_10_-_Alex_Ionescu_-_Slides_-_Black_Hat_2016.pdf
The Linux Scheduler - A Decade of Wasted Cores - 2016 (eurosys16-final29)
The Little Book of Semaphores - Version 2.1.5 (downey08semaphores)
_(downey08semaphores).pdf
The Longest Common Extension Problem Revisited and Applications to Approximate String Searching (2010)
The Memory Pool System
The Microarchitecture of Intel, AMD and VIA CPUs - An Optimization Guide for Assembly Programmers and Compiler Makers (2018)
The Need for Asynchronous, Zero-Copy Network IO - Drepper (Slides)
The Night Watch
The Notorious Four-Color Problem
The NT Insider (2017-01)
The NumPy Array - A Structure for Efficient Numerical Computation (2011)
ient_Numerical_Computation_(2011).pdf
The NumPy Array - A Structure for Efficient Numerical Computation - 8th Feb 2011 (1102.1523)
Theory and Practice of Monotone Minimal Perfect Hashing
Theory of Locality Sensitive Hashing - CS246 Stanford (Slides)
The Probabilistic Relevance Framework - BM25 and Beyond
The Query-flow Graph - Model and Applications (2008)
The ReactOS Project - An Open Source OS Platform for Learning - Slides - Ionescu (2007)
The RecordLinkage Package - Detecting Errors in Data
The Reversal Test - Eliminating Status Quo Bias in Applied Ethics
The Reyes Image Rendering Architecture - 1987
The RFB Protocol (v3.0, 26-Nov-2010)
The RFB Protocol v3.8 (26 Nov 2010)
The R Inferno (30th April, 2011)
Thermometer Encoding - One Hot Way To Resist Adversarial Examples - ICLR 2018
The Road Towards a Linux TSN (Time-Sensitive Network) Infrastructure - Intel - Slides - 2018 (ELC-2018-USA-TSNonLinux)
The Robust Beauty of Improper Linear Models in Decision Making - July 1979
The Roots of Trigonometric Integrals - 1950 (597490)
The Saddest Moment
These Are Not Your Grand Daddys CPU Performance Counters - CPU Hardware Performance Counters For Security - Slides (2015)
The Significance of SIMD, SSE and AVX - Intel - Slides (3a_SIMD)
The Skein Hash Function Family - v1.2 - 15 Sep 2009 (skein1.2)
09_(skein1.2).pdf
The Slow Winter
The Transactional Memory - Garbage Collection Analogy (analogy_oopsla07)
The Trill Incremental Analytics Engine (MSR-TR-2014-54)
The Ubiquitous B-Tree - 1979 (comer-b-tree)
The UNIX Time-Sharing System (1974)
The UVM Virtual Memory System (1999)
The VAD Tree - A Process-Eye View of Physical Memory (2007)
The Vertica Analytic Database- C-Store 7 Years Later (p1790_andrewlamb_vldb2012)
Things You Didn't Known About Portable Executable File Format (PECOFF) - Slides - 2011 (BH_US_11_VuksanPericin_PECOFF_Slides)
Thirty-three Miniatures - Mathematical and Algorithmic Applications of Linear Algebra - 2017 (stml-53-matousek-1)
This World of Ours
Threads and DragonFlyBSD - Slides - 2009 (luciani_dcbsdcon2009)
Thrill - High-Performance Algorithmic Distributed Batch Data Processing in C++ - Slides (2016)
Thrill - High-Performance Algorithmic Distributed Batch Data Processing with C++ (1608.05634)
Thrust - A Productivity-Oriented Library for CUDA (2012)
Time, Clocks, and the Ordering of Events in a Distributed System - Leslie Lamport, 1978 (p558-lamport)
TinyLFU - A Highly Efficient Cache Admission Policy (1512.00727)
Tokutek - Data Structures and Algorithms for Big Databases
Tokutek - Fractal Tree Technology and the Art of Indexing
Tokutek - Solving the Challenges of Big Databases with MySQL (MySQL Connect 2012)
es_of_Big_Databases_with_MySQL_(MySQL_Connect_2012).pdf
Topic Indexing - Slides
Topics in IRIX 6.5 Programming
Topological Transformation Approaches To Database Query Processing (2015)
To Search or to Crawl - Toward a Query Optimizer for Text-Centric Tasks (sigmod2006)
Towards a Database System for Large-scale Analytics on Strings - PhD Thesis (2015)
Towards Deep Symbolic Reinforcement Learning - 2016 (1609.05518)
Towards Deep Symbolic Reinforcement Learning - 2016 (1609.05518v2)
Towards End-to-End Speech Recognition with Recurrent Neural Networks (graves14)
To Wash It All Away
Trace-based Just-in-Time Type Specialization for Dynamic Languages - 2009 (tracemonkey)
Tracing Function Calls in the Windows NT Kernel - PhD Thesis - 2015 (BPTX_2014_2_11320_0_348076_0_164038)
Tracing Privileged Memory Accesses to Discover Software Vulnerabilities (2015)
Tracing the Meta-Level - PyPy’s Tracing JIT Compiler - 2009 (bolz-tracing-jit-final)
Track Join - Distributed Joins with Minimal Network Traffic (sigmod14II)
Training of CC4 Neural Network using Unary and Spread-Unary Inputs (Potluri_okstate_0664M_14453)
Transactional Memory - CS4021 - Slides
Transparent Pointer Compression for Linked Data Structures (2005-06-12)
Traps and Pitfalls of Topic-Biased PageRank
Tries and String Matching - Slides - 2009 (Small09)
er.petergarner.net
Tries and Suffix Tries - Slides (Ben Langmead, Johns Hopkins)
ns_Hopkins).pdf
Trig Cheat Sheet
True IOMMU Protection from DMA Attacks - When Copy is Faster than Zero Copy - 2016 (cim-asplos-2016)
TruRank - Taking PageRank to the Limit
Tuning a Database Reorganization for Maximum Speed (Quest Software)
Twenty-Five Comparators is Optimal when Sorting Nine Inputs (and Twenty-Nine for Ten) (1405.5754)
Two-Way String Matching (1991)
Ultrafast and Memory-Efficient Alignment of Short DNA Sequences to the Human Genome - 2009 (gb-2009-10-3-r25)
Unary Coding for Neural Network Learning (1009.4495)
Unary Negation - 2013 (1309.2069)
Understanding and Expressing Scalable Concurrency - Aaron Turon - Thesis (2013)
Understanding and Improving Bloom Filter Configuration for Lazy Address-set Disambiguation (2011)
Understanding and Using Atomic Memory Operations - GTC 2013 - Slides (S3101-Atomic-Memory-Operations)
ing_and_Using_Atomic_Memory_Operations_-_GTC_2013_-_Slides_(S3101-Atomic-Memory-Operations).pdf
Understanding Deep Learning Requires Rethinking Generalization - 2016 (1611.03530v1)
_Requires_Rethinking_Generalization_-_2016_(1611.03530v1).pdf
Understanding Latency Hiding on GPUs - August 12th, 2016 (EECS-2016-143)
Understanding Open Market Operations
Understanding the Basis of the Kalman Filter Via a Simple and Intuitive Derivation (2012)
s_of_the_Kalman_Filter_Via_a_Simple_and_Intuitive_Derivation_(2012).pdf
Understanding the Overheads of Launching CUDA Kernels (Poster17-moc)
Understanding the Performance of PCI Express Systems - Xilinx (October, 2014)
Understanding the Python GIL - David Beazley (2010)
er.petergarner.net
Undocumented PECOFF (BH_US_11_VuksanPericin_PECOFF_WP)
f
Unified Memory - Notes on GPU Data Transfers (2017)
er.petergarner.net
Uninformed v4a1 - Improving Automated Analysis of Windows x64 Binaries (2006)
Universal and Perfect Hashing (lect1004)
UNIX IO and its Slouch Towards Multicore NUMA (libtorque)
UNIX Time Sharing System - UNIX Programmer's Manual - Seventh Edition, Volume 1A - January, 1979 (v7vol1a)
UNIX Time Sharing System - UNIX Programmer's Manual - Seventh Edition, Volume 2A - January, 1979 (v7vol2a)
UNIX Time Sharing System - UNIX Programmer's Manual - Seventh Edition, Volume 2B - January, 1979 (v7vol2b)
Unmixed d-uniform and r-partite Hypergraphs - 2016 (1605.02655)
16_(1605.02655).pdf
Unreliable Guide to Hacking the Linux Kernel (2000)
er.petergarner.net
UofW - Memory Hierarchy
uops.info - Characterizing Latency, Throughput, and Port Usage of Instructions on Intel Microarchitectures - 10 Oct 2018 (1810
User Mode Memory Page Management
Using CUDA in Practice - GPU Programming - CSE 591 - Slides
Using Graphics Processors for Parallelizing Hash-based Data Carving - 2009 (10.1.1.405.6531)
essors_for_Parallelizing_Hash-based_Data_Carving_-_2009_(10.1.1.405.6531).pdf
Using Memory Management to Detect and Extract Illegitimate Code for Malware Analysis - Slides - 2012
Using non-volatile memory (NVDIMM-N) as byte-addressable storage in Windows Server 2016 (P470)
Variants of Mersenne Twister Suitable for Graphic Processors - 21 Mar 2012 (1005.4973)
ter_Suitable_for_Graphic_Processors_-_21_Mar_2012_(1005.4973).pdf
VAX-VMS Internals 2 Student Workbook (Oct-86, EY-2280E-SG-0001)
Vectorized Bloom Filters for Advanced SIMD Processors - Columbia - Slides
Vectorized Bloom Filters for Advanced SIMD Processors (damon14)
Verification of the Tree-Based Hierarchical Read-Copy Update in the Linux Kernel - 10th October, 2016 (1610.03052)
Verification Techniques
Versioned external-memory dictionaries with optimal query-update tradeoffs - 2011 (1103.2566v2)
Vim Book (vimbook-OPL)
Vim for Humans
Virtualization Without Direct Execution or Jitting - Designing a Portable Virtual Machine Infrastructure

Virtual Threads - 2000 (cs263_cheong_reiss)
Visual Studio, Microsoft Portable Executable and Common Object File Format Specification - Revision 9.3 - 29th Dec, 2015 (peco
Vulcan - Binary Transformation in a Distributed Environment (tr-2001-50)
tributed_Environment_(tr-2001-50).pdf
Wake-up Latencies for Processor Idle States on Current x86 Processors - Slides (2014)
essor_Idle_States_on_Current_x86_Processors_-_Slides_(2014).pdf
Warp Shuffles, and Reduction and Scan Operations - CUDA - Slides
Weaving Relations for Cache Performance - 2001 (P169)
Weird Things that Surprise Academics Trying to Commercialize a Static Checking Tool (spin05-coverity)
What Every Programmer Should Know About Memory - Ulrich Drepper (2007)
emory_-_Ulrich_Drepper_(2007).pdf
What Happens During a Join - Dissecting CPU and Memory Optimization Effects (P339)
What's New In Apple File Systems - Slides - WWDC 2019
What's Wrong With Deep Learning (lecun-20150610-cvpr-keynote)
When Corrections Fail - The Persistence of Political Misperceptions (nyhan-reifler)
When Prefetching Works, When It Doesn't, and Why - ACM, 2012 (lee_taco12)
When To Use Splay Trees (2007)
Why Aren't Operating Systems Getting Faster As Fast As Hardware - WRL-TN-11 (October 1989)
Why BitBlt was So Successful - SIGGRAPH 84 (pike84bitblt)
Why Modern CPUs Are Starving And What Can Be Done About It - Francesc Alted (StarvingCPUs-CISE-2010)
Why Rust (2015)
Why Threads Are A Bad Idea (For Most Purposes) - John Ousterhout (Sept 1995)
t_Purposes)_-_John_Ousterhout_(Sept_1995).pdf
Win32 Static Analysis in Python - Ero Carrera - Sabre Security GmbH (Slides)
WinDbg - A to Z (Slides)
WinDbg Cheat Sheet
Windows 10 Control Flow Guard Internals (mj0011)
Windows 10 Internals
Windows 8 Registered IO (SAC-593T_Briggs)
0
Windows and Some Differences from Linux - Slides (Brian Railing)
Windows - A Software Engineering Odyssey (Lucovsky)
er.petergarner.net
Windows Assembly Programming Tutorial - Jeff Huang (v1.02, Dec 10 2003)
Windows Commands
Windows - Disk Subsystem Performance Analysis (March 2004)
Windows Error Codes
Windows Filter Manager - Slides (2003)
Windows Kernel Architecture Internals (Dave_Probert_1)
f
Windows Kernel Attacks through User-Mode Callbacks (Black Hat USA 2011)
Windows Kernel Debugging Tutorial
Windows Kernel Internals - Advance Virtual Memory
Windows Kernel Internals - Cache Manager
Windows Kernel Internals - IO Architecture
Windows Kernel Internals - Lightweight Procedure Calls
f
Windows Kernel Internals - NTFS
Windows Kernel Internals - NT Registry Implementation
Windows Kernel Internals - Object Manager
0
Windows Kernel Internals - Overview
Windows Kernel Internals - Synchronization
Windows Kernel Internals - Traps, Interrupts and Exceptions
eptions.pdf
Windows Kernel - MSDN Export (7th Feb, 2019)
Windows Logon Forensics - 30th Jan 2013 (6928)
Windows Network Services Internals - Hivercon 2003 (Jean-Baptiste Marchand)
Windows New Security Features - Control Flow Guard - Slides (MR201412_Control_Flow_Guard_ENG)
ty_Features_-_Control_Flow_Guard_-_Slides_(MR201412_Control_Flow_Guard_ENG).pdf
Windows NT pagefile.sys Virtual Memory Analysis
Windows Persistent Memory Support (20160811_S301B_Christiansen)
B_Christiansen).pdf
Windows Privilege Escalation Through LPC and ALPC Interfaces (June, 2008)
Windows Research Kernel - Design Notes (David Cutler et al, 1989)
Windows - Timers, Timer Resolution, and Development of Efficient Code (10 June 2016)
olution,_and_Development_of_Efficient_Code_(10_June_2016).pdf
Windows User-Mode Drivers - Alex Ionescu (2012)
Witnesses for Non-Satisfiability of Dense Random 3CNF Formulas (May 9th, 2006)
Writing a Simple Operating System from Scratch - Nick Blundell - Dec 2010
Writing Linux Device Drivers in Assembly Language - 2002
2.pdf
Writing Network Drivers in Go (2018-ixy-go)
Writing Network Drivers in Rust (2018-ixy-rust)
Writing R Extensions
x86 Intrinsics Cheatsheet v2.1
x86 Intrinsics Cheatsheet v2.2
Xorshift RNGs - George Marsaglia (2003)
X-Ray - A Function Call Tracing System
xv6 - a simple, Unix-like teaching operating system (Aug 28 2012, draft 7)
ZeroMQ
ZFS Administration Guide (2007)
ZFS On-Disk Data Walk (Or, Where's My Data) - Slides (2008)
_(2008).pdf
ZFS On-Disk Specification - Draft - 2006 (ondiskformat0822)