troubleshoot   1937

« earlier    

Oracle Memory Troubleshooting, Part 4: Drilling down into PGA memory usage with V$PROCESS_MEMORY_DETAIL | Tanel Poder's Performance Tuning & Troubleshooting Page
SQL> ORADEBUG SETMYPID
SQL> ORADEBUG DUMP PGA_DETAIL_GET <process.pid>
SQL> SELECT * FROM v$process_memory_detail ORDER BY pid, bytes DESC;
oracle  memory  troubleshoot 
8 days ago by some_hren
Profiling Ansible Tasks
in 2.0: [global] callback_whitelist = profile_tasks
ansible  performance  troubleshoot 
13 days ago by some_hren
Виртуализация - Механизм Degraded Device Handling в VMware vSAN.
SAN 6.1 ищет устройства, на которых операции ввода-вывода вызывают задержки более 50 мс. Если такое поведение на устройстве сохраняется в течение 10 минут, то vSAN отключает это устройство и вызывает аларм. Если таким устройством является кэш-диск, то в офлайн выводится вся дисковая группа (к счастью, современные SSD-диски весьма надежны).

Вот что будет в этом случае в логах:

2015-09-15T02:21:27.270Z cpu8:89341)VSAN Device Monitor: WARNING – READ Average Latency on VSAN device naa.6842b2b006600b001a6b7e5a0582e09a has exceeded threshold value 50 ms 1 times.

2015-09-15T02:21:27.570Z cpu5:89352)VSAN Device Monitor: Unmounting VSAN diskgroup naa.6842b2b006600b001a6b7e5a0582e09a
Компоненты на такой дисковой группе механизм DDH помечает как "Absent". Ребилд для таких компонентов начнется через 60 минут после отказа устройства, когда истечет rebuild timer. Если этот компонент не является частью группы RAID-1 или RAID-5/6, то он становится недоступным.

В случае с RAID-1 все продолжает работать, и если компонент witness работает, то вы получите только оповещение в vSphere Client
...
Улучшения DDH в vSAN 6.2.
Здесь появилось 4 новых момента:

1. DDH размонтрует диск (кэширующий или обычный) только в случае превышения задержек на запись. При появлении задержек на чтение диск не будет выводиться в офлайн, так как это окажет большее негативное влияние на кластер в целом, чем вывод диска и последующий ребилд.

2. По умолчанию DDH не размонтирует кэш-девайсы и в случае превышения latency на запись. Поскольку это ведет к выводу в офлайн всей дисковой группы, было сделано решение, что такое поведение несет больше вреда, чем медленная работа кэш-устройства. Но это дефолтное поведение можно изменить следующей командой (затрагивает не только кэш, но и диски с данными):

esxcfg-advcfg –set 1 /LSOM/lsomSlowTier1DeviceUnmount

После ее выполнения кэш-устройства и их дисковые группы будут размонтироваться при привышении порога latency на запись.

3. DDH мониторит устройства в рамках случайных 10-минутных интервалов и учитывает несколько таких интервалов. Это предотвращает ложные срабатывания механизма в случае таких операций, как vSAN component recovery, ремапинг секторов HDD-дисков, сбор мусора на SSD и прочее. Теперь для срабатывания DDH нужно 4 превышения latency в непоследовательных 10-минутных интервалах, которые случайно распределены в окне 6-7 часов.

4. DDH пытается снова смонтировать устройства vSAN, которые были ранее размонтированы по превышению latency. Число таких попыток - 24 в окне 24 часа (то есть примерно раз в час). Если условие размонтирования сохраняется, то попытки обратного монтирования прекратятся через сутки.

Улучшения DDH в vSAN 6.6 и более поздних версиях.
Эти улучшения базируются на улучшениях в прошлых версиях. Если посмотреть на прошлый пункт, то понятно, что DDH отключает только диски с данными (не трогает кэш-устройства) и только если latency на запись превышает заданное значение.

Для HDD дисков был сделан threshold 500 миллисекунд на запись, для SSD - 50 миллисекунд на чтение и 200 миллисекунд на запись.

Теперь, если вышедший из строя диск является последней копией данных, но с него еще как-то можно получить данные, то vSAN не пометит диск как Absent, но начнет эвакуацию данных, таймер vSAN CLOM Rebuild Timer не включится.
vsan  hardware  storage  troubleshoot 
18 days ago by some_hren
Selectel IPv4 prefix route leaking / Блог компании Селектел / Хабр
В ходе диагностики определён номер автономной системы, которая анонсирует некорректные маршруты на РС2 DE-CIX, AS 2854. Кто это? Эта информация нужна для того, чтобы оперативно смочь связаться с ними и сказать, что там делают «не дело». AS 2854 — это российская «дочка» глобального оператора Equant (он же Orange Business Services), ранее в РФ эта компания называлась Роспринт.
internet  routing  troubleshoot  postmortem  bgp  equant 
28 days ago by some_hren
tanelpoder/tpt-oracle: Tanel Poder's Troubleshooting & Performance Tools for Oracle databases
These sqlplus scripts are for Oracle Database performance optimization & troubleshooting. Most of the scripts should be runnable directly from SQL Developer too.
oracle  sql  queries  performance  troubleshoot 
4 weeks ago by some_hren
ajv@^6.0.0 is missing · Issue #9691 · angular/angular-cli
I fixed this for myself by installing: npm install ajv@^6.0.0 from within the project directory. Not sure if this is the best way of dealing with the issue.
github  forum  angular  angular-cli  npm  install  howto  troubleshoot  issue  error  ajv  dependency  project  guide  reference 
7 weeks ago by racl101

« earlier    

related tags

$_server  $_server['php_self']  (universal)  -  004  10  1c  2018  8100  9200  a  address  ajv  alamofire  alias  android  angular-cli  angular  ansible  app  app_cipher  app_key  apple  application  april  askubuntu  authentication  authenticator  authority  bar  beanstalkd  bearer  bestpractices  bgp  blade  blank  block  blog  bluetooth  boot  bootstrap  bootstrap3  box  bug  build  builder  bus  byte  byteman  cable  cacert.pem  can  capture  car  carlson  carryover  caveat  cell  ceph  cert  certbot  certificate  cgpoint  cgsize  character  chrysler  closure  cocoapod  code  column  command  communications  compilation  compile  compiler  composer  conflict  connect  connection  container  contentinsetadjustmentbehavior  control  country  crect  curl  cursor  data  database  deadondiagnostics  debian  debian_stretch  debug  debugging  declaration  delete  dependency  derived  desenvolvimento  destroy  development  diagnostic  directive  disk  docker  doctrine  documentation  driver  dropbox  duplicate  dx20180312xd  easy  ecm  elasticsearch  electronics  elm  elm630ds  else  emulator  encoding  engine  equant  error  example  examples  exception  explanation  explorer  export  fast  file  fix  flow  format  forum  free  fridge  gdb  github  global  gotcha  grunt  guide  hardware  help  home  homestead  howto  hp  http  identifier  if  include  incorrect  index  init  initializer  install  installation  instantiator  interface  internal  internet  invoiceninja  io  ios  ios11  issue  issues  java  javascript  jboss  jk-training  jquery  js  json  justin  jvm  key  keychain  laravel-mix  laravel  laravel5.2  laravel5.5  laravel5  launch  lazy  letsencrypt  lin  linker  linux  linux_general  listen  loading  localrankingfailures  login  long  lts  mac  macbookpro  macos  macosx  main  malware  mapping  markup  medium  memory  message  method  microsoft  migration  miller  modal  module  monitor  monitoring  mr  multi  mustache  mysql-python  mysql  n/a  navigation  network  new  newline  nginx  nissan  node  nodejs  not  notification  npm  number  nvm  obdmx  objectivec  old  operand  operator  options  oracle  oracle12  order  osx  package  packet  page  passport  password  patch  pdo  pem  performance  permission  php-fpm  php  php7  phpini  picoscope  plugin  port  postgres  postgresql  postman  postmortem  printer  probe  problems  programming  project  prompt  provision  provisioning  pyenv  pymysql  python  python2.7  queries  query  queue  rails  rds  redcap  redis  reference  refresh  refused  reload  rename  rendering  reset  restart  return  ror  routing  rubyonrails  run  runtime  rv  sci  screen  script  secret  selector  self  sem  seo  server  service  shell  simulator  single  smm  sniff  spa  spelunkerd  sql  ssh  ssl  stackexchange  stackoverflow  standalone  statement  stats  status  stdlib  sticky  storage  storyboard  stretch  string  submarine  super  supervisord  support  survey  swift  swift3  swift4  switch  sync  system  tcpdump  template  term  test  tls  to  token  tolearn  tool  toolkit  tools  totry  tounderstand  traffic  transparent  troubleshooting  try_files  tutorial  types  ubiquiti  ubuntu  ubuntu16.04  uikit  uitableview  uitableviewcell  uiv  unary  unicorn  unifi  unresolved  unzip  update  updating  upgrade  utf8  utf8mb4  util  vagrant  value  variable  vendor  version  video  virtualbox  virtualhost  visual_studio  vsan  vue  vue2  vuejs  webdev  wifi  wiki  windows  windows7  wireless  with  word  workaround  workspace  xcode  xcode9.2  xcode9  z-index  zabbix  zip 

Copy this bookmark:



description:


tags: