shell   67719

« earlier    

Command-line Tools can be 235x Faster than your Hadoop Cluster | Adam Drake
This problem of unused cores can be fixed with the wonderful xargs command, which will allow us to parallelize the grep. Since xargs expects input in a certain way, it is safer and easier to use find with the -print0 argument in order to make sure that each file name being passed to xargs is null-terminated. The corresponding -0 tells xargs to expected null-terminated input. Additionally, the -n how many inputs to give each process and the -P indicates the number of processes to run in parallel. Also important to be aware of is that such a parallel pipeline doesn’t guarantee delivery order, but this isn’t a problem if you are used to dealing with distributed processing systems. The -F for grep indicates that we are only matching on fixed strings and not doing any fancy regex, and can offer a small speedup, which I did not notice in my testing.
shell 
11 minutes ago by some_hren
о силе юникса - Поклонник деепричастий
Кнут написал программу для нахождения N самых частых слов в данном тексте. Он придумал хитрую структуру данных для хранения промежуточных частот, которую было особенно удобно поддерживать в процессе сканирования текста. На программу Кнута написал рецензию Даг Макилрой, который помимо прочего решил ту же задачу с помощью шести команд юниксовской командной строки:

$ tr -cs A-Za-z \n |
tr A-Z a-z
sort | uniq -c | sort -rn | head -$1
unix  shell 
19 minutes ago by some_hren
Shell parameter expansion - Today I Learned
Shells can perform variable expansion, this is really useful for default argument variables in shell functions.
shell  bash  default 
19 hours ago by microspino
GitHub - junegunn/fzf: A command-line fuzzy finder
:cherry_blossom: A command-line fuzzy finder. Contribute to junegunn/fzf development by creating an account on GitHub.
bash  tools  cli  search  shell 
yesterday by rona25

« earlier    

related tags

2004  2009  advice  alternativeto  analysis  app  archeology  article  ascii  assembly  autocomplete  awk  backup  bash  bestpractices  bioinformatics  blog  c++  c  calculator  cannot  carbon_markets  cd  change  cheatsheet  cli  climat  climate  climatechange  cmake  code  collections  color  command-line  command  commandline  configuration  console  cool  csvkit  d.programming.language  data  data:csv  data:json  data:science  data:sql  datascience  default  desktop  dev  development  devops  directory  document  documentation  dotfiles  dump  equivalence  example  faq  files  fish  font  format  forumthread  freebsd  fun  garbage  geek  genomics  gh  git  github-star  github  gogo  golang  gui  hacker  hacking  help  history  howto  http  human  ifttt  in-depth  influence  instant-preview  interesting  iphone  java  javascript  jquery  json  launchctl  learn  link  links  lint  linter  linux  lisp  list  live-programming  locale  logging  long  lua  mac  macos  management  markdown  markup  material  midden  minimalism  ml  mound  movie  must-have  network  networking  neural  newsletter  objectivec  octopus  oil  online  opensource  osx  parallelism  paris  path  perl  pinboard-fixup-github-titles  pipe  pipes  plaintext  plugin  posix  productivity  programme  programming  python  reference  relative  replacement  rlang  ruby  rust  scifi  script  scripting  search  sed  setup  shall  shellscripting  simplicity  software  softwaretesting  sort  spreadsheet  ssh  stackexchange  stackoverflow  standards  statistics  stats  suncor  symlink  sysadmin  tcl  tdd  terminal  testing  tex  textprocessing  tips  tlcl  tmux  tool  toolkit  tools  totry  tricks  tui  tutorial  typescript  ui  unix  up  vim  warelogging  waste  wifi  wiki  windows  xml  zsh 

Copy this bookmark:



description:


tags: